你的隐私，大数据怎知道？我们又该如何自我保护？(2)

如果将“人肉搜索”与大数据挖掘相比，网友被电脑所替代；网友们收集的信息，被数据库中的海量异构数据所替代；网友寻找各种人物关联的技巧，被相应的智能算法替代；网友们相互借鉴、彼此启发的做法，被各种同步运算所替代。

各次迭代过程仍然照例进行，只不过机器的迭代次数更多，速度更快，每次迭代其实就是机器的一次“学习”过程。网友们的最终“满意画像”，被暂时的挖掘结果所替代。之所以说是暂时，那是因为对大数据挖掘来说，永远没有尽头，结果会越来越精准，智慧程度会越来越高，用户只需根据自己的标准，随时选择满意的结果就行了。

当然，除了相似性外，“人肉搜索”与“大数据挖掘”肯定也有许多重大的区别。例如，机器不会累，它们收集的数据会更多、更快，数据的渠道来源会更广泛。总之，网友的“人肉搜索”，最终将输给机器的“大数据挖掘”。

4.隐私保护与数据挖掘“危”“机”并存

必须承认，就当前的现实情况来说，大数据隐私挖掘的“杀伤力”，已经远远超过了大数据隐私保护的能力；换句话说，在大数据挖掘面前，当前人类有点不知所措。这确实是一种意外。自互联网诞生以后，在过去几十年，人们都不遗余力地将碎片信息永远留在网上。其中的每个碎片虽然都完全无害，可谁也不曾意识到，至少没有刻意去关注，当众多无害碎片融合起来，竟然后患无穷！

不过，大家也没必要过于担心。在人类历史上，类似的被动局面已经出现过不止一次了。从以往的经验来看，隐私保护与数据挖掘之间总是像“走马灯”一样轮换的——人类通过对隐私的“挖掘”，获得空前好处，产生了更多需要保护的“隐私”，于是，不得不再回过头来，认真研究如何保护这些隐私。当隐私积累得越来越多时，“挖掘”它们就会变得越来越有利可图，于是，新一轮的“挖掘”又开始了。历史地来看，人类在自身隐私保护方面，整体处于优势地位，在网络大数据挖掘之前，“隐私泄露”并不是一个突出的问题。

但是，现在人类需要面对一个棘手的问题——对过去遗留在网上的海量碎片信息，如何进行隐私保护呢？单靠技术，显然不行，甚至还会越“保护”，就越“泄露隐私”。

因此，必须多管齐下。例如从法律上，禁止以“人肉搜索”为目的的大数据挖掘行为；从管理角度，发现恶意的大数据搜索行为，对其进行必要的监督和管控。另外，在必要的时候，还需要重塑“隐私”概念，毕竟“隐私”本身就是一个与时间、地点、民族、文化等有关的约定俗成的概念。

对于个人的网络行为而言，在大数据时代，应该如何保护隐私呢？或者说，至少不要把过多包含个人隐私的碎片信息遗留在网上呢？答案只有两个字：匿名！只要做好匿名工作，就能在一定程度上，保护好隐私了。也就是说，在大数据技术出现之前，隐私就是把“私”藏起来，个人身份可公开，而大数据时代，隐私保护则是把“私”公开(实际上是没法不公开)，而把个人身份隐藏起来，即匿名。

2/2 首页上一页 1 2