一种基于隐私保护的数字出版物畅销度预测方法技术

技术编号:33290481 阅读:30 留言:0更新日期:2022-05-01 00:08
本发明专利技术涉及一种基于隐私保护的数字出版物畅销度预测方法,所述方法涉及到的系统包括两个部分:数字出版服务平台和服务请求者,服务请求者通常为书店、出版社、图书电商平台等,数字出版服务平台包括以下实体:平台读者、边缘服务器和平台服务器。服务请求者可以根据平台提供的统计分析结果获得图书畅销排行榜、新书畅销程度预测、某位作家作品受欢迎程度分析等服务,以便指导自己下一步的出版或商业计划。本发明专利技术提出的系统和方法在不泄漏服务请求者隐私,即请求者的统计偏好和读者隐私,即读者的阅读信息的情况下,获得图书畅销排行榜、新书畅销程度预测以及某位作家作品受欢迎程度。度。度。

【技术实现步骤摘要】
一种基于隐私保护的数字出版物畅销度预测方法


[0001]本专利技术涉及信息安全领域,特别是涉及一种基于隐私保护的数字出版物畅销度预测方法。

技术介绍

[0002]充分挖掘和利用海量读者阅读数据所蕴含的价值,为数字图书商务网站、出版商、书店等出版企业提供在经营、出版、销售等方面决策上的帮助,是大数据在数字出版领域的一种应用,具有非常重要的实际价值。同时,大数据时代隐私问题越发凸显和受到关注。个体隐私得不到很好的保护势必会影响大数据相关应用的使用和推广。读者阅读的信息蕴含着大量关于读者的隐私信息,如年龄、爱好、性格等。数字图书商务网站、出版商、书店等出版企业提出的服务需求也蕴含着企业投资偏好、出版偏好、未来营销倾向等商业敏感信息。因此,如何在不泄漏读者隐私信息和数字图书商务网站、出版商、书店等出版企业隐私信息情况下实现对海量读者阅读数据进行与出版企业服务需求相匹配的统计分析是一个非常具有应用价值的重要课题。

技术实现思路

[0003]本专利技术的目的是提供一种基于隐私保护的数字出版物畅销度预测方法,在不泄漏服务请求者隐私(即请求者的统计偏好)和读者隐私(即读者的阅读信息)的情况下获得图书畅销排行榜、新书畅销程度预测、某位作家作品受欢迎程度分析等服务。
[0004]为实现上述目的,本专利技术提供了如下方案:
[0005]一种基于隐私保护的数字出版物畅销度预测方法,所述方法包括:
[0006]S1:对系统进行初始化;所述系统包括:数字出版服务平台和多个服务请求者User;所述数字出版服务平台包括:平台服务器PS、多个边缘设备ES以及海量读者Reader;
[0007]S2:User明确本次统计分析的目标类别OCName的值,生成对应的统计偏好{ISBN1,ISBN2,

,ISBN
V
};
[0008]S3:User生成一个长度为L的向量BF,并初始化为0,即BF[1]=BF[2]=...=BF[L]=0,同时生成K个哈希函数H1,H2,

,H
K
,其中H
k
:任意长度字符串

[1

L],k=1,2,

,K;
[0009]S4:User根据统计偏好{ISBN1,ISBN2,

,ISBN
V
}利用K个哈希函数设置向量BF:BF[H
k
(ISBN
v
)]=1,其中k=1,2,

,K,v=1,2,

,V;
[0010]S5:User收集步骤S4中BF中值为1的所有位置信息得到一个位置集合Los;
[0011]S6:User从{1,2,

,L}/Los中随机选择K/2个位置,将随机选择的位置并入到所述集合Los中得到过滤位置集合FLos;
[0012]S7:User利用超递增序列{b1=1,b2,b3,

}将所述集合FLos中的位置信息封装为一个整数,用符号B表示所述整数;
[0013]S8:User利用平台服务器的公钥和加密算法E加密整数B和目标类别名称OCName得到密文C1=E(pk
PS
,B)和C2=E(pk
PS
,OCName);
[0014]S9:User将(H1,H2,

,H
K
,C1,C2)作为服务请求提交给平台服务器PS;
[0015]S10:平台服务器PS利用自己的私钥对收到的密文C2进行解密得到目标类别名称OCName=D(sk
PS
,C2);
[0016]S11:平台服务器PS将(H1,H2,

,H
K
,OCName)广播给平台的海量读者;
[0017]S12:第i个读者Reader
i
,i=1,2,

,n,根据接收到的目标类别名称OCName整理自己相关的阅读信息;所述阅读信息包括:阅读过该类别图书的ISBN列表;
[0018]S13:第i个读者Reader
i
生成一个长度为L的向量BF
i
并将所述向量BF
i
所有位置上的值初始化为0,然后依次将自己整理得到的ISBN列表中的每个值代入到K个哈希函数得到K个哈希值,将向量中所述K个哈希值所指示位置上的值设置为1,最后该读者得到的设置结果BF
i
(s
i,1
,s
i,2
,

,s
i,L
);
[0019]S14:第i个读者Reader
i
在大小为p的有限域内构造个一元m阶多项式;
[0020]S15:第i个读者Reader
i
基于得到的设置结果BF
i
(s
i,1
,s
i,2
,

,s
i,L
)和步骤S14中的T个多项式构造T个一元m阶多项式;
[0021]S16:第i个读者Reader
i
为平台服务器PS生成秘密份额;
[0022]S17:第i个读者Reader
i
将所述第i个读者Reader
i
为平台服务器PS生成的秘密份额发送给平台服务器PS;
[0023]S18:第i个读者Reader
i
为第j个边缘设备ED
j
,j=1,2,

,m,生成秘密份额;
[0024]S19:第i个读者Reader
i
将所述第i个读者Reader
i
为第j个边缘设备ED
j
,生成的秘密份额发送给第j个边缘设备ED
j
和第jmod m+1个边缘设备ED
jmod m+1

[0025]S20:第j个边缘设备ED
j
将收到来自n个读者的秘密份额进行聚合;
[0026]S21:第j个边缘设备ED
j
将计算得到的聚合份额发送给平台服务器PS;
[0027]S22:平台服务器PS将收到来自n个读者的秘密份额进行聚合;
[0028]S23:如果平台服务器PS没有收到来自第j个边缘设备ED
j
的聚合份额,则平台服务器通知第j

1个边缘设备ED
j
‑1发送聚合份额,如果平台服务器没有收到来自第1个边缘设备ED1的聚合份额,那么平台服务器通知第m个边缘设备ED
m
发送聚合份额;
[0029]S24:平台服务器PS基于收到的聚合份额和自己计算得到的聚合份额利用拉格朗日插值公式重构2T个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护的数字出版物畅销度预测方法,其特征在于,所述方法包括:S1:对系统进行初始化;所述系统包括:数字出版服务平台和多个服务请求者User;所述数字出版服务平台包括:平台服务器PS、多个边缘设备ES以及海量读者Reader;S2:User明确本次统计分析的目标类别OCName的值,生成对应的统计偏好{ISBN1,ISBN2,

,ISBN
V
};S3:User生成一个长度为L的向量BF,并初始化为0,即BF[1]=BF[2]=...=BF[L]=0,同时生成K个哈希函数H1,H2,

,H
K
,其中H
k
:任意长度字符串

[1

L],k=1,2,

,K;S4:User根据统计偏好{ISBN1,ISBN2,

,ISBN
V
}利用K个哈希函数设置向量BF:BF[H
k
(ISBN
v
)]=1,其中k=1,2,

,K,v=1,2,

,V;S5:User收集步骤S4中BF中值为1的所有位置信息得到一个位置集合Los;S6:User从{1,2,

,L}/Los中随机选择K/2个位置,将随机选择的位置并入到所述集合Los中得到过滤位置集合FLos;S7:User利用超递增序列{b1=1,b2,b3,

}将所述集合FLos中的位置信息封装为一个整数,用符号B表示所述整数;S8:User利用平台服务器的公钥和加密算法E加密整数B和目标类别名称OCName得到密文C1=E(pk
PS
,B)和C2=E(pk
PS
,OCName);S9:User将(H1,H2,

,H
K
,C1,C2)作为服务请求提交给平台服务器PS;S10:平台服务器PS利用自己的私钥对收到的密文C2进行解密得到目标类别名称OCName=D(sk
PS
,C2);S11:平台服务器PS将(H1,H2,

,H
K
,OCName)广播给平台的海量读者;S12:第i个读者Reader
i
,i=1,2,

,n,根据接收到的目标类别名称OCName整理自己相关的阅读信息;所述阅读信息包括:阅读过该类别图书的ISBN列表;S13:第i个读者Reader
i
生成一个长度为L的向量BF
i
并将所述向量BF
i
所有位置上的值初始化为0,然后依次将自己整理得到的ISBN列表中的每个值代入到K个哈希函数得到K个哈希值,将向量中所述K个哈希值所指示位置上的值设置为1,最后该读者得到的设置结果BF
i
(s
i,1
,s
i,2
,

,s
i,L
);S14:第i个读者Reader
i
在大小为p的有限域内构造个一元m阶多项式;S15:第i个读者Reader
i
基于得到的设置结果BF
i
(s
i,1
,s
i,2
,

,s
i,L
)和步骤S14中的T个多项式构造T个一元m阶多项式;S16:第i个读者Reader
i
为平台服务器PS生成秘密份额;S17:第i个读者Reader
i
将所述第i个读者Reader
i
为平台服务器PS生成的秘密份额发送给平台服务器PS;S18:第i个读者Reader
i
为第j个边缘设备ED
j
,j=1,2,

,m,生成秘密份额;S19:第i个读者Reader
i
将所述第i个读者Reader
i
为第j个边缘设备ED
j
,生成的秘密份额发送给第j个边缘设备ED
j
和第j mod m+1个边缘设备ED
jmodm+1
;S20:第j个边缘设备ED
j
将收到来自n个读者的秘密份额进行聚合;S21:第j个边缘设备ED
j
将计算得到的聚合份额发送给平台服务器PS;S22:平台服务器PS将收到来自n个读者的秘密份额进行聚合;
S23:如果平台服务器PS没有收到来自第j个边缘设备ED
j
的聚合份额,则平台服务器通知第j

1个边缘设备ED
j
‑1发送聚合份额,如果平台服务器没有收到来自第1个边缘设备ED1的聚合份额,那么平台服务器通知第m个边缘设备ED
m
发送聚合份额;S24:平台服务器PS基于收到的聚合份额和自己计算得到的聚合份额利用拉格朗日插值公式重构2T个多项式[F1(x),F2(x),

,F
T
(x),F1′
(x),F2′
(x),

,F
T

(x)];S25:平台服务器PS依次检查的多项式F1(x)和F
′1(x)至多项式F
T
(x)和F

T
(x)的常数项是否相等,如果存在不相等,则平台服务器重启本次服务响应,否则执行下面的步骤;S26:平台服务器PS通过计算F1(x)

F
′1(x)、F2(x)

F
′2(x)、
……
、F
T
(x)

F

T
(x)并提取得到的多项式的系数,获得统计结果S27:平台服务器PS利用自己的私钥对收到的密文C1进行解密得到B=D(sk
PS
,C1),并利用超递增序列{b1=1,b2,b3,

}解析B得到过滤位置集合FLos;S28:平台服务器PS根据过滤位置集合FLos过滤统计结果S28:平台服务器PS根据过滤位置集合FLos过滤统计结果得到服务请求者的服务响应S29::平台服务器PS利用服务请求者的公钥加密服务响应得到密文S29::平台服务器PS利用服务请求者的公钥加密服务响应得到密文并将密文{C

l
}
l∈FLos
作为服务响应返回给服务请求者User;S30:服务请求者User利用自己的私钥解密收到的密文获得服务响应S31:服务请求者User根据自己的统计偏好{ISBN1,ISBN2,

,ISBN
V
}、K个哈希函数和服务响应得到序列中每个ISBN的统计结果;所述统计结果为:有多少平台读者已经阅读过该ISBN对应的图书,已经阅读过该ISBN对应的图书,其中v=1,2,

,V。2.根据权利要求1所述的基于隐私保护的数字出版物畅销度预测方法,其特征在于,所述系统初始化具体包括以下步骤:平台服务器选择一个大素数p;系统里的操作在大小为p的有限域内完成;平台服务器选择一个超递增序列,所述递增序列用来压缩封装传输的数据;平台服务器设置两个系统公开参数L和K的值,参数L的值用来限定后续阶段中生成的向量的长度,参数K的值用来限定后续阶段中生成的哈希函数的个数;平台服务器选择一个加密算法,并生成所述加密算法的相应参数以及自己的公私钥对。3.根据权利要求1所述的基于隐私保护的数字出版物畅销度预测方法,其特征在于,所述步骤S14中个一元m阶多项式的表达式如下所示:f

i,1
(x)=a

i,1,0
+a

i,1,1
x+

+a

i,1,m
x
m
(mod p)f

i,2
(x)=a

i,2,0
+a

i,2,1
x+

+a

i,2,m
x
m
(mod p)
……
f

i,T
(x)=a

i,T,0
+a

i,T,1
x+

+a

i,T,m
x
m
(mod p)
所述多项式中的系数a

i,t,0
,a

i,t,1
,

,a

i,t,m
均是从有限域中随机选择的非零值,其中t=1,2,

,T;所述多项式中的x为一元变量。4.根据权利要求1所述的基于隐私保护的数字出版物畅销度预测方法,其特征在于,所述步骤S15中T个一元m阶多项式的表达式如下:f
i,1
(x)=a

i,1,0
+a
i,1,1
x+

+a
i,1,m
x
m
(mod p)f
i,2
(x)=a

i,2,0
+a
i,2,1
x+

+a
i,2,m
x
m
(mod p)
……
f
i,T
(x)=a

i,T,0
+a
i,T,1
x+

+a
i,T,m
x
m
(mod p)所述多项式中的常数项系数a

i,1,0
,a

i,2,0
,

,a

i,T,0
为上述步骤S14中构造的多项式的常数项系数,它们均是非零随机数;所述多项式中的非常数项系数分别为:a
i,1,1
=a

i,1,1
+s
i,1
,a
i,1,2
=a

i,1,2
+s
i,2
,

,a
i,1,m
=a

i,1,m
+s
i,m
a
i,2,1
=a

i,2,1
+s
i,m+1
,a
i,2,2
=a

i,2,2
+s
i,m+2
,

,a
i,2,m
=a

i,2,m
+s
i,2m
……
,a
i,T

1,1
=a

i,T

1,1
+s
i,(T

2)m+1
,a
i,T

1,2
=a

i,T

1,2
+s
i,(T

2)m+2
,

,a
i,T

1,m
=a

i,T

1,m
+s
i,(T

1)m
a
i,T,1
=a

i,T,1
+s
i,(T

1)m+1
,a
i,T,2
=a

i,T,2
+s
i,(T

1)m+2
,

,a
i,T,L

(T

1)m
=a

i,T,L

(T

1)m
+s
i,L
,a
i,T,L

(T

1)m+1
=a<...

【专利技术属性】
技术研发人员:沈华王志伟徐烺
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1