计算;推算;计数设备的制造及其应用技术1.本发明属于空间众包隐私保护技术领域,更具体地,涉及一种空间众包中保护工人语义隐私的方法和系统。背景技术:2.隐私保护是空间众包领域的四大核心问题之一,空间众包平台执行空间众包服务,会先获取到工人和任务的信息,并根据这些信息进行任务分配,在任务分配之前,需要获取工人的位置信息,其位置包含个人敏感信息,如用户的生活习惯、健康状态等,如若在这个过程中,工人的信息未经过处理直接提交给平台,其个人信息则会泄露给众包平台,导致工人的位置隐私泄露,如果隐私受到侵犯,移动用户可能不会同意参与空间众包活动,因此,确保位置隐私是空间众包成功的关键。当下空间众包的隐私保护技术均是对移动用户位置坐标进行保护,然而用户的位置信息不仅是地图中某个位置坐标,各种基础设施位于这些位置,比如商店、公交站、医院和学校等。这些基础设施可以被视为位置语义,如果这种信息不能得到适当的处理,它们可能会泄露更多移动用户的个人或企业秘密,而不是简单的坐标,将移动用户的位置语义暴露给敌对广告商和基于位置的垃圾邮件,可能导致社会声誉或经济损失,甚至是身体暴力。因此一个在空间众包中保护工人位置坐标以及语义隐私的方法有着较大的显示意义。3.目前应用在空间众包领域的隐私保护方法,包括考虑工人位置坐标的隐私保护方法、以及位置语义的隐私保护方法。4.现有的工人位置坐标隐私保护方法主要是基于差分隐私来实现的,第一种方法是基于差分隐私的隐私保护方案,根据真实工人数据集将隐私空间划分为两层网格结构,并采用噪声机制添加噪声,从而保证了工人位置坐标的隐私;第二种方法也是基于差分隐私的保护方案,该方案采用自适应三级网格分解和自适应完全金字塔分解,将工人和任务的位置划分到多层网格当中并添加噪声,从而考虑到了网格粒度与位置坐标隐私。5.现有的位置语义隐私保护方法主要是应用在基于位置服务和道路网方面,第一种是属性感知的隐私保护方案,用于增加移动用户的位置语义隐私,该方案从局部映射中提取基本属性,并构建了基于属性的层次结构,基于这些信息将局部地区划分为不同的多边形,再通过四色图进行着色,构造位置查询集,以保护位置语义隐私;第二种方法是基于语义感知的隐私保护模型(closed),通过设计一种覆盖道路网络不同语义区域并满足服务质量的隐藏集,采用一种贪婪算法来平衡服务质量与隐私要求,以保护路网位置语义隐私。6.然而,上述方法都存在一些不可忽略的缺陷:基于差分隐私的空间众包工人隐私保护方法,并未考虑语义条件,在隐私空间构建的过程中,当区域位置语义较为相近、甚至单一时,区域划分出的均匀网格中可能存在网格语义单一的情况,进而泄露工人位置语义隐私,若基于语义构建隐私空间,需要考虑如何度量位置语义之间的差异性,以及不同的任务分配方法等;关于位置语义隐私的保护方案主要在基于位置的服务与道路网方面应用,未考虑在空间众包中的应用场景,而空间众包中工人的位置语义亦是敏感信息,该信息的泄露也会导致用户对平台失去信任。技术实现要素:7.针对现有技术的以上缺陷或改进需求,本发明提供了一种空间众包中保护工人语义隐私的方法,其目的在于,解决在空间众包中基于语义的隐私保护方法中无法度量隐私空间语义的问题,以及现有基于差分隐私的空间隐私保护方法中工人位置语义隐私泄露的问题,以及基于语义构建隐私空间的任务分配问题,以及语义隐私在空间众包没有相关应用的问题。8.为实现上述目的,按照本发明的一个方面,提供了一种空间众包中保护工人语义隐私的方法,包括如下步骤:9.(1)获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;10.(2)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;11.(3)获取任务位置坐标,根据该位置坐标以及步骤(2)构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配。12.优选地,步骤(1)具体为,首先是获取点数据集,并确定其对应的基础语义;随后,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;其后,根据得到的多个子语义构建一个三层语义树模型;最后,确定三层语义树模型对应的语义权值,并结合标准差的定义确定网格语义相似度。13.优选地,步骤(1)具体包括以下子步骤:14.(1-1)获取点数据集,并确定其对应的基础语义,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;15.(1-2)对步骤(1-1)获取的多个子语义确定基础语义的权值范围,以及每个子语义的权值,进而得到一个三层语义树模型,如图3所示。16.(1-3)利用步骤(1-2)获取到的三层语义树模型并结合标准差的定义获取网格语义相似度。17.优选地,基础语义的权值范围为:[0018][0019]其中t表示自定义划分范围,|s|表示基础语义的总数,λ表示基础语义的编号,且有λ∈[1,步骤(1-1)得到的基础语义总数];[0020]对应子语义的权值等于:[0021][0022]其中,表示子语义所对应的权值,λ表示基础语义的编号,i表示子语义的编号且该子语义属于编号为λ的基础语义,其中i∈[1,步骤(1-1)得到的子语义总数],m和n是两个常数,其中m表示子语义为的位置总数,n表示基础语义为sλ的位置总数,表示子语义为的位置点,表示编号为i的子语义且该子语义属于编号为λ的基础语义,j为一个计数器,表示子语义为的位置序号(如表示子语义为的位置点中第j个位置点),且有j∈[1,m],lock(sλ)表示基础语义为sλ的位置点,sλ表示编号为λ的基础语义,k表示基础语义为sλ的位置点序号,且有k∈[1,n];[0023]网格语义相似度为:[0024][0025]其中,sim为网格语义相似度,n1为常数,其表示网格中的位置点总数,表示在网格中的第j1个位置点,其中j1∈[1,n1],表示位置点的对应子语义权值,sim值越小,表示网格语义相似度越高,反之亦然。[0026]优选地,步骤(2)具体包括以下子步骤:[0027](2-1)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域,并获取选中区域内的工人位置信息,包括位置坐标和位置语义;[0028](2-2)利用(2-1)获取到的选中区域内的工人位置信息,对该选中区域进行网格划分,以得到第一层网格,并根据第一层网格的隐私预算∈1添加拉普拉斯随机噪声到第一层网格中,以得到加噪后的第一层网格;[0029](2-3)根据步骤(2-2)获取到加噪后的第一层网格,计算第一层网格的网格语义相似度,确定网格语义相似度阈值θ1,并根据θ1对第一层网格进行重组,以得到经重组后的第一层网格。[0030](2-4)对步骤(2-3)获取到的重组后的第一层网格,确定网格语义相似度阈值θ2,根据θ2对第一层网格进行分割,得到经分割后的第二层网格,再根据第二层网格的隐私预算∈2,添加拉普拉斯随机噪声到第二层网格中,以得到加噪后的第二层网格。[0031](2-5)根据步骤(2-4)获取到加噪后的第二层网格,计算第二层网格的网格语义相似度,并对网格语义相似度小于θ1的第二层网格进行重组。[0032]优选地,步骤(2-2)具体为,首先,根据工人位置信息获取选中区域内的工人总数,并根据工人总数确定第一层网格的划分粒度m1,根据第一层网格的划分粒度将选中区域划分为m1×m1的第一层网格;[0033]具体而言,粒度m1为:[0034][0035]其中,n(c)为选中区域内的工人总数,∈为全部隐私预算,其中∈∈(0,1),k1是一个常数,其取值为10。[0036]随后,在第一层网格划分完成后,确定第一层网格的隐私预算∈1,其中∈1=∈×α,α表示隐私预算分配比率,且α∈(0,1)),然后,根据第一层网格的隐私预算∈1,添加拉普拉斯随机噪声到第一层网格中,并确定第一层网格的噪声计数,噪声计数为:[0037][0038]其中q(d)表示真实工人数,表示在的范围内服从laplace分布的一个随机噪声,以得到加噪后的第一层网格。[0039]步骤(2-3)具体为,首先,计算第一层网格中每个网格对应的网格语义相似度,确定网格语义相似度阈值θ1,随后,根据θ1对第一层网格进行重组,其中,重组是对网格语义相似度小于θ1的第一层网格进行合并,其重组过程中的终止条件,是当重组区域网格语义相似度大于阈值θ1时,停止合并,或当重组区域超过选中区域时,停止合并,得到重组后的第一层网格。[0040]优选地,步骤(2-4)具体为,首先,确定网格语义相似度阈值θ2,随后,根据θ2对第一层网格进行分割,其中,分割是对网格语义相似度大于θ2的第一层网格进行再划分,第一层网格再划分为m2×m2的第二层网格;[0041]其中粒度m2为:。[0042][0043]其中,为第一层网格中的噪声计数,表示在第一层网格中序号为i1的网格,1表示该网格在第一层网格,i1∈[1,第一层网中的网格总数],∈2为第二层网格的隐私预算,∈2=∈-∈1,k2值是一个常数,其取值为[0044]步骤(2-5)具体为,首先,计算第二层网格中每个网格的网格语义相似度,随后,对网格语义相似度小于θ1的网格进行重组,其重组过程的终止条件,是当重组区域网格语义相似度大于阈值θ1时,停止合并,或当重组区域超过其所属的第一层网格范围,停止合并。[0045]优选地,步骤(3)具体包括以下子步骤:[0046](3-1)获取任务请求者的位置坐标,根据该位置坐标,并结合步骤(2)构建的隐私空间分解结构,获取该位置坐标在隐私空间分解结构中所属的最小单位区域作为地理投射区域,并获取该地理投射域的任务接受率,即至少有一个工人接受任务的概率;[0047](3-2)判断步骤(3-1)得到的地理投射域的任务接受率是否高于期望成功率,如果是则转入步骤(3-3),否则转入步骤(3-4)。[0048](3-3)获取步骤(3-2)获取的地理投射域中需要通知的工人数,并判断通知的工人数是否小于最大工人数,如果是则过程结束,并通知在该地理投射域内的全部工人,完成任务分配,否则说明存在系统开销过大的情况,转入步骤(3-5)。[0049](3-4)根据步骤(3-2)获取到的地理投射域,对该地理投射域进行区域扩张,获取扩张后的地理投射域中需要通知的工人数,判断通知的工人数是否小于最大工人数,如果是则过程结束,通知地理投射域中的所有工人,完成任务分配,否则说明存在系统开销过大的情况,转入步骤(3-5)。[0050](3-5)根据步骤(3-3)得到的地理投射域和需要通知的工人数、或(3-4)扩张后的地理投射域和需要通知的工人数,对地理投射域内的工人进行随机抽样,以获得最少工人数:[0051][0052]其中eu为期望成功率,p参照步骤(3-1)。[0053](3-6)根据步骤(3-5)获取到的最少工人数,随机抽取部分工人,该部分工人的数量在最少工人数与通知的工人数之间(以保证该地理投射域的任务分配成功率能够达到期望成功率),并通知在地理投射域内的部分工人完成任务分配。[0054]优选地,步骤(3-1)中的任务接受率p为:[0055]p=1-(1-pa)w[0056]其中w表示地理投射域中的工人总数,每个工人接受任务的概率pa为:[0057][0058]其中pm为任务的最大接受率,davg表示工人所在的地理投射域与任务之间的距离,dm表示工人的最大移动距离。[0059]步骤(3-4)中对地理投射域进行区域扩张这一过程具体为,首先是获取到地理投射域的邻接网格,并根据步骤(3-1)计算邻接网格相对于任务的任务接受率,然后,根据邻接网格的任务接受率对邻接网格进行排序,贪心地选择任务接受率最高的邻接网格,并将该邻接网格添加到地理投射域中,其后,计算扩张后的地理投射域的任务分配成功率(区域扩张后的地理投射域内至少有一个工人接受任务的概率),判断地理投射域是否达到终止条件,如果是则停止区域扩张,否则,继续进行地理投射域的区域扩张;其中扩张后的任务分配成功率p’gr为:[0060]p’gr=1-(1-pgr)(1-p)[0061]pgr是区域扩张前的任务分配成功率,p为新添加邻接网格的任务接受率。[0062]按照本发明的另一方面,提供了一种空间众包中保护工人语义隐私的方法,包括:[0063]第一模块,用于获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;[0064]第二模块,用于根据第一模块获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;[0065]第三模块,用于获取任务位置坐标,根据该位置坐标以及第二模块构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配。[0066]总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:[0067](1)本发明由于采用了步骤(1),通过构建三层语义树模型,以度量位置语义之间的差异性,同时,提出了一种网格语义相似度计算方法,进而可对网格以及地理投射域的语义相似度进行度量,其因此能够解决在空间众包中基于语义的隐私保护方法中无法度量隐私空间语义的问题。[0068](2)本发明由于采用了步骤(2),通过基于语义构建隐私空间分解结构,在保证差分隐私条件的前提下,进一步从语义的角度构建隐私空间分解结构,即在保证工人位置坐标隐私的同时也保护了工人的位置语义隐私,其因此能够解决现有基于差分隐私的空间隐私保护方法中工人位置语义隐私泄露的问题。[0069](3)由于本发明采用了步骤(3),通过基于语义构建隐私空间分解结构,进行任务分配,并针对任务分配过程中可能出现的系统开销过大的问题进行优化,其因此能够解决基于语义构建隐私空间的任务分配问题。[0070](4)由于本发明采用了步骤(1)到(3),通过在空间众包领域保护工人的位置语义隐私,因此能够解决语义隐私在空间众包没有相关应用的问题。附图说明[0071]图1是本发明空间众包中保护工人语义隐私的方法流程图;[0072]图2是本发明的一个简易语义树图;[0073]图3是本发明的三层语义树模型结构示意图;[0074]图4是本发明地图选中区域示意图;[0075]图5是本发明构建隐私空间分解结构的过程示意图;[0076]图6是本发明保护工人语义隐私的系统示意图;[0077]图7是本发明测试结果示意图。具体实施方式[0078]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。[0079]本发明的基本思路在于,根据三层语义树模型计算隐私空间划分后的网格语义相似度,以此基于语义构建满足差分隐私且具有语义隐私保护效果的隐私空间分解结构,同时根据该隐私空间分解结构进行任务分配,并对系统开销过大的情况进行优化。[0080]如图1所示,本发明提供了一种空间众包中保护工人语义隐私的方法,包括如下步骤:[0081](1)获取区域点数据集,并确立对应的基础语义,根据该点数据集以及基础语义对点数据集对应的点位置语义进行统计和分类,根据统计和分类结果构建三层语义树模型,并确定三层语义树模型对应的语义权值、以及网格语义相似度;[0082]具体而言,本步骤首先是获取点数据集(可以是从点数据集网站中获得,或者直接从数据库中获得),并确定其对应的基础语义(包括例如美食、服务、娱乐、教育、购物、医药与其它);随后,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;其后,根据得到的多个子语义构建一个三层语义树模型,其简易示例如图2所示;最后,确定三层语义树模型对应的语义权值,并结合标准差的定义确定网格语义相似度。[0083]在本实施方式中,点数据集是基于位置的,点数据集多为城市历史位置信息,该点数据集中的数据对应着某个位置的坐标以及位置所对应的语义,如商店、商场、餐厅等。[0084]本步骤具体包括以下子步骤:[0085](1-1)获取点数据集,并确定其对应的基础语义,根据基础语义对点数据集对应的位置语义进行统计和分类,以得到多个子语义;[0086]在本发明中,将语义分为基础语义以及基础语义分支下的子语义,子语义在基础语义的范畴之内,基础语义可根据不同点数据集的情况,进行不同的定义,这里确定为美食、服务、娱乐、教育、购物、医药与其它,同时,可对基础语义的顺序进行个性化调整,因为其顺序可影响基础语义之间差异性。[0087]基础语义确定后,根据基础语义将子语义分类到对应基础语义分支下,作为对应基础语义的子语义。例如,可将快餐店、中餐馆、西餐厅等语义划分到基础语义美食的分支下作为其子语义,由于语义的区分可能存在不同,因此可以有不同的分类结果,最后根据分类结果统计子语义在点数据集中的数量。[0088](1-2)对步骤(1-1)获取的多个子语义确定基础语义的权值范围,以及每个子语义的权值,进而得到一个三层语义树模型,如图3所示。[0089]基础语义的权值范围为:[0090][0091]其中t(t》0)表示自定义划分范围,|s|表示基础语义的总数,λ表示基础语义的编号,且有λ∈[1,步骤(1-1)得到的基础语义总数];[0092]对应子语义的权值等于:[0093][0094]其中,表示子语义所对应的权值,λ表示基础语义的编号,i表示子语义的编号且该子语义属于编号为λ的基础语义,其中i∈[1,步骤(1-1)得到的子语义总数],m和n是两个常数,其中m表示子语义为的位置总数,n表示基础语义为sλ的位置总数,表示子语义为的位置点,表示编号为i的子语义且该子语义属于编号为λ的基础语义,j为一个计数器,表示子语义为的位置序号(如表示子语义为的位置点中第j个位置点),且有j∈[1,m],lock(sλ)表示基础语义为sλ的位置点,sλ表示编号为λ的基础语义,k表示基础语义为sλ的位置点序号(如lock(sλ)表示基础语义为sλ的位置点中第k个位置点),且有k∈[1,n]。[0095]如图2所示,例如,若设置划分范围t=70、|s|=7,基础语义美食有1000个位置,其子语义饮品有200个位置,糕点有100个位置,美食对应的编号为1,对应子语义有饮品与糕点,在基础语义美食下的编号分别为1和2,则饮品对应权值糕点对应权值[0096](1-3)利用步骤(1-2)获取到的三层语义树模型并结合标准差的定义获取网格语义相似度(网格是隐私空间分解结构中的部分区域,如图5中的c(1,1)即是第一层网格中的一个网格)。[0097]网格语义相似度为:[0098][0099]其中,sim为网格语义相似度,n1为常数,其表示网格中的位置点总数,表示在网格中的第j1个位置点,其中j1∈[1,n1],表示位置点的对应子语义权值,sim值越小,表示网格语义相似度越高,反之亦然。[0100]例如,若在隐私空间划分后,存在一网格内有5个工人,其对应位置点子语义权值分别为1.2、2、1.6、1.1、2.1,则通过上式计算得值为0.6,可知该网格对应的网格语义相似度较高。[0101]上述步骤(1-2)到(1-3)的优点在于,可以得到一个语义树模型,从而对位置语义进行区分,以度量位置语义之间的差异性,同时,可度量隐私空间分解结构中网格的语义相似度。[0102](2)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域内的工人位置信息,并根据该工人位置信息构建隐私空间分解结构;[0103]具体而言,本步骤中构建的隐私空间分解结构可保证差分隐私,同时具有语义隐私保护效果,具体的构建过程如图5所示;[0104]本步骤具体包括以下子步骤:[0105](2-1)根据步骤(1)获取到的三层语义树模型以及网格语义相似度,获取选中区域(地图中划分的一块位置区域,图4所示的黑色矩形框即是划分的一块东京市的部分位置区域),并获取选中区域内的工人位置信息,包括位置坐标(用经纬度表示)和位置语义(如学校、医院等);[0106](2-2)利用(2-1)获取到的选中区域内的工人位置信息,对该选中区域进行网格划分,以得到第一层网格,并根据第一层网格的隐私预算添加拉普拉斯随机噪声到第一层网格中,以得到加噪后的第一层网格;[0107]具体而言,本步骤首先,根据工人位置信息获取选中区域内的工人总数,并根据工人总数确定第一层网格的划分粒度m1,根据第一层网格的划分粒度将选中区域划分为m1×m1的第一层网格;[0108]具体而言,粒度m1为:[0109][0110]其中,n(c)为选中区域内的工人总数,∈为全部隐私预算,其中∈∈(0,1),k1是一个常数,其取值为10。[0111]随后,在第一层网格划分完成后,确定第一层网格的隐私预算∈1,其中∈1=∈×α,α表示隐私预算分配比率,且α∈(0,1)),然后,根据第一层网格的隐私预算∈1,添加拉普拉斯随机噪声到第一层网格中,并确定第一层网格的噪声计数,噪声计数为:[0112][0113]其中q(d)表示真实工人数,表示在的范围内服从laplace分布的一个随机噪声,以得到加噪后的第一层网格。[0114](2-3)根据步骤(2-2)获取到加噪后的第一层网格,计算第一层网格的网格语义相似度,确定网格语义相似度阈值θ1,并根据θ1对第一层网格进行重组,以得到经重组后的第一层网格。[0115]具体而言,首先,计算第一层网格中每个网格对应的网格语义相似度,确定网格语义相似度阈值θ1(网格语义相似度阈值下界,表示语义隐私保护效果的下限值,视不同语义隐私保护要求而定),随后,根据θ1对第一层网格进行重组,其中,重组是对网格语义相似度小于θ1的第一层网格进行合并(仅在选中区域范围内)。其重组过程中的终止条件,是当重组区域(第一层网格合并后的区域)网格语义相似度大于阈值θ1时,停止合并,或当重组区域超过选中区域时,停止合并,得到重组后的第一层网格。[0116]举例来说,如图5,若给定的θ1=10,在第一层网格中,网格c(1,2),c(1,3)合并为了一个新的网格c(1,1),即是橙色框包围区域,相似的c(1,4),c(1,7),c(1,8)合并为了网格c(1,2),因为它们都是连通的同时网格语义相似度小于θ1。[0117]在本步骤中,网格语义相似度小于θ1的第一层网格是不满足语义条件的,即网格语义相似度较高,可能存在语义单一的情况进而导致工人位置语义隐私的泄露。[0118]上述步骤(2-1)到步骤(2-3)的优点在于,可以自适应地构建隐私空间分解结构的第一层网格,且该第一层网格可满足差分隐私条件且保证一定语义隐私保护效果,进而保证工人位置坐标隐私与位置语义隐私。[0119](2-4)对步骤(2-3)获取到的重组后的第一层网格,确定网格语义相似度阈值θ2,根据θ2对第一层网格进行分割,得到经分割后的第二层网格,再根据第二层网格的隐私预算∈2,添加拉普拉斯随机噪声到第二层网格中,以得到加噪后的第二层网格。[0120]具体而言,首先,确定网格语义相似度阈值θ2(网格语义相似度阈值上界,表示语义隐私保护效果的上限值),随后,根据θ2对第一层网格进行分割,其中,分割是对网格语义相似度大于θ2的第一层网格进行再划分,第一层网格再划分为m2×m2的第二层网格;[0121]具体而言,其粒度m2为:。[0122][0123]其中,为第一层网格中的噪声计数,表示在第一层网格中序号为i1的网格,1表示该网格在第一层网格,i1∈[1,第一层网中的网格总数],∈2为第二层网格的隐私预算,∈2=∈-∈1,k2值是一个常数,其取值为[0124]对于网格语义相似度在θ1和θ2之间的第一层网格不做处理。[0125]举例来说,如图5所示,若给定的θ2=15,在第一层网格中,对c(1,1)和c(1,9)进行了再分割,因为其网格语义相似度大于θ2。[0126]在第一层网格分割为第二层网格后,根据(2-2)中拉普拉斯随机噪声公式,将第一层网格的隐私预算替换为第二层网格的隐私预算,并添加拉普拉斯随机噪声到第二层网格中,以得到加噪后的第二层网格。[0127]在本步骤中,对于网格语义相似度大于θ2的第一层网格,是网格语义相似度较低的情况,语义隐私不易泄露,且该情况的网格的工人数较多,则可分割该网格。[0128](2-5)根据步骤(2-4)获取到加噪后的第二层网格,计算第二层网格的网格语义相似度,并对网格语义相似度小于θ1的第二层网格进行重组。[0129]具体而言,首先,计算第二层网格中每个网格的网格语义相似度,随后,对网格语义相似度小于θ1的网格进行重组,其重组过程的终止条件,是当重组区域(第二层网格合并后的区域)网格语义相似度大于阈值θ1时,停止合并,或当重组区域超过其所属的第一层网格范围(即是第一层网格中进行分割的网格,举例来说,如图5中,第一层网格中c(1,9)进行分割得到了第二层网格c(2,10),c(2,11),c(2,12),c(2,13),则第二层网格若进行重组不得超过第二层网格c(1,9)的区域范围),停止合并。[0130]对于网格语义相似度大于θ1的网格不做处理。[0131]举例来说,如图5,在第二层网格中网格c(2,1),c(2,4),c(2,6),c(2,8)合并为了c(2,1),c(2,10),c(2,11)合并为c(2,2)。[0132]最后得到一个两层的隐私空间分解结构,对网格的加噪处理保证了差分隐私条件,根据网格语义相似度重组网格保证了一定的语义隐私保护效果。[0133]上述步骤(2-4)到步骤(2-5)的优点在于,可以自适应地构建隐私空间分解结构的第二层网格,对第二层网格的重组可以保证工人的位置语义隐私,同时加噪可保证第二层网格满足差分隐私条件。[0134](3)获取任务位置坐标,根据该位置坐标以及步骤(2)构建的隐私空间分解结构进行任务分配,以获取一个地理投射域,在该地理投射域中出现工人过多的情况时进行优化,并通知地理投射域中的全部工人或部分工人完成任务分配,在该地理投射域中未出现工人过多的情况时通知部分工人完成任务分配;[0135]本步骤具体包括以下子步骤:[0136](3-1)获取任务请求者的位置坐标,根据该位置坐标,并结合步骤(2)构建的隐私空间分解结构,获取该位置坐标在隐私空间分解结构中所属的最小单位区域(第一层或第二层网格中的网格)作为地理投射区域,并获取该地理投射域的任务接受率,即至少有一个工人接受任务的概率;[0137]具体而言,任务接受率p为:[0138]p=1-(1-pa)w[0139]其中w表示地理投射域中的工人总数,每个工人接受任务的概率pa为:[0140][0141]其中pm为任务的最大接受率(当工人与任务处在同一位置时,接受率最大),davg表示工人所在的地理投射域(可能包含多个网格)与任务之间的距离,dm表示工人的最大移动距离。[0142]本步骤的优点在于,可以度量地理投射域的任务接受率,该地理投射域中可包含多个网格。[0143](3-2)判断步骤(3-1)得到的地理投射域的任务接受率是否高于期望成功率(一个概率阈值),如果是则转入步骤(3-3),否则转入步骤(3-4)。[0144]具体而言,本步骤中的期望成功率取值范围是0.85到0.95,优选为0.9。[0145](3-3)获取步骤(3-2)获取的地理投射域中需要通知的工人数,并判断通知的工人数是否小于最大工人数(其表示通知工人的最大数量,视不同情况而定,最大工人数对于不同的地区不同,比如东京和纽约,两个城市对应的最大工人数不同),如果是则过程结束,并通知在该地理投射域内的全部工人,完成任务分配,否则说明存在系统开销过大的情况,转入步骤(3-5)。[0146](3-4)根据步骤(3-2)获取到的地理投射域,对该地理投射域进行区域扩张,获取扩张后的地理投射域中需要通知的工人数,判断通知的工人数是否小于最大工人数,如果是则过程结束,通知地理投射域中的所有工人,完成任务分配,否则说明存在系统开销过大的情况,转入步骤(3-5)。[0147]本步骤中对地理投射域进行区域扩张这一过程具体为,首先是获取到地理投射域的邻接网格,并根据步骤(3-1)计算邻接网格相对于任务的任务接受率,然后,根据邻接网格的任务接受率对邻接网格进行排序,贪心地选择任务接受率最高的邻接网格,并将该邻接网格添加到地理投射域中,其后,计算扩张后的地理投射域的任务分配成功率(区域扩张后的地理投射域内至少有一个工人接受任务的概率),判断地理投射域是否达到终止条件(任务分配成功达到期望成功率或地理投射域超过工人的最大移动距离),如果是则停止区域扩张,否则,继续进行地理投射域的区域扩张。[0148]具体而言,扩张后的任务分配成功率p’gr为:[0149]p’gr=1-(1-pgr)(1-p)[0150]pgr是区域扩张前的任务分配成功率,p为新添加邻接网格的任务接受率,参考步骤(3-2)。[0151]本步骤的优点在于,提出了区域扩张的任务分配成功率计算方法,并可贪心地扩张地理投射域以达到期望成功率,确定最终的地理投射域。[0152](3-5)根据步骤(3-3)得到的地理投射域和需要通知的工人数、或(3-4)扩张后的地理投射域和需要通知的工人数,对地理投射域内的工人进行随机抽样,以获得最少工人数:[0153][0154]其中eu为期望成功率,p参照步骤(3-1)。[0155](3-6)根据步骤(3-5)获取到的最少工人数,随机抽取部分工人,该部分工人的数量在最少工人数与通知的工人数之间(以保证该地理投射域的任务分配成功率能够达到期望成功率),并通知在地理投射域内的部分工人完成任务分配。[0156]本步骤的优点在于,可根据地理投射域以及通知的工人数,优化系统开销,同时保证地理投射域对应的任务分配成功率不低于期望成功率。[0157]在本发明的一个具体应用中,如图6所示,该应用中主要包含四个角色,分别是工人、任务请求者、第三方可信平台(通常为移动运营商)以及空间众包服务平台,如图中,首先,工人将个人位置信息汇报给第三方可信平台,第三方可信平台首先获取到整个区域(如长沙市)的位置语义信息,并率先构建属于该区域的三层语义树模型,同时,根据工人提供的位置信息以及本发明中的隐私空间分解结构方法构建满足差分隐私条件同时可保护工人语义隐私的隐私空间分解结构,由于该结构进行了加噪和语义隐藏处理,因此可同时保护工人的位置坐标和语义信息,可直接将该隐私空间分解结构上传到空间众包服务器。[0158]然后,任务请求者向空间众包平台请求空间众包服务并上传任务位置坐标,空间众包平台在接受到该任务请求后,根据上述隐私空间分解结构进行任务分配,即是首先锁定一个最小地理投射域并评估其任务分配成功率,当未达到期望成功率,则进行区域扩张并重新评估任务分配成功率,当达到终止条件(达到期望成功率或达到超过工人最大移动距离)时,则确定最终的地理投射域,并将该任务分配得到的地理投射域发送给第三方可信平台。[0159]第三方可信平台在获取到该地理投射区域后,便统计该区域内工人数量,若工人数量超过最大工人数则随机抽取部分工人并确定需要通知的工人,最后逐一通知该区域中的工人,工人接收到通知后,选择是否执行该任务,当工人同意执行任务,则该任务分配完成。[0160]测试结果[0161]本发明的测试环境:在python3.7平台上使用python语言编写,运行硬件环境为3.20ghz amd ryzen 5800h八核处理器,内存大小为16gb。[0162]本发明通过真实数据集进行测试,该数据集包含在纽约和东京收集的约10条月登记信息.其中,包含在纽约的227428条和在东京的573703条,每个登记都与它的gps坐标和语义相关联。测试中所用到的数据是从原始数据中随机抽取的一部分,分别从纽约和东京数据集中进行随机抽样,并根据两个数据集设定了最大移动距离为3.6km。[0163]为了说明本发明对语义隐私保护效果的提升,我们通过固定一个参数并改变另一个参数值来进行实验,主要探讨语义相似度阈值对语义隐私保护效果的影响,在图7中,tky-p(tokyo-primary)表示东京数据集对应的基于差分隐私构建的隐私空间分解结构(nyc-p对应纽约数据集),nyc-m(new york city-modified)表示纽约数据集对应的基于语义构建的隐私空间分解结构(tky-m对应东京数据集)。[0164]在本测试中,固定了k2值并设置为15,将参数k1的改变范围设置为了2~14,由图7-a所示结果可以分析看出:随着阈值下界k1的增大,语义条件逐渐变得严格,基于差分隐私构建的隐私空间分解结构对应的语义隐私保护效果均呈现下降的趋势,基于语义构建的隐私空间分解结构对应保护效果同样有下降的趋势,但是波动不明显,同时,在不同的数据集上,本发明基于语义构建的隐私空间分解结构的语义隐私保护效果都比基于差分隐私构建的隐私空间分解结构的效果好许多,均高出近30%左右。[0165]在本测试中,固定了k1值并设置为7,将参数k2的改变范围设置为了10~30,由图7-b所示结果可以分析看出:随着阈值上界的k2增大,网格向下划分条件变得更加严格,向下划分网格数量也有所减少,基于语义构建的隐私空间分解结构的网格数量会有明显下降,对应的语义隐私保护效果也会有波动,同时,对于不同数据集,分布不同也会有不同效果,但保护效果都优于基于差分隐私构建的隐私空间分解结构,最多高出了近40%左右,同时,可以看到基于差分隐私构建的隐私空间分解结构对应的结果没有变化,是因为的k2改变不会影响其构建的过程和隐私保护效果的评估。[0166]从以上两个测试可以得到:本发明的的基于语义构建的隐私空间分解结构相较于基于差分隐私构建的隐私空间分解结构有更好的语义隐私保护效果,且都能有一个高出近30%左右的效果,且保持较为稳定的状态。[0167]本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
图片声明:本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!
内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,发布内容不收取任何费用也不接任何广告!
免责声明:我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!
一种空间众包中保护工人语义隐私的方法和系统 专利技术说明
作者:admin
2023-07-07 17:37:09
981
关键词:
计算;推算;计数设备的制造及其应用技术
专利技术