首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

租客网:如何解决好一二线大城市租房市场的突出问题?

随着中国城镇化进程不断推进,大量人口开始向一二线城市流动。从需求端的角度看,租房市场的需求几乎成为了永恒的需求。从供给端的角度看,却普遍存在这许多问题,比如供需失配、总体规模较小、租住体验差、市场杂乱亟待规范、租金价格过高等。如何解决好一二线大城市租房市场的突出问题,是如今一个不可忽视的重大命题。在出现多次的长租暴雷事件后,用事实向我们证明了依旧稀缺难寻的真“长租公寓”,难道真的没有更简单更便利可信的第三种租赁模式了吗?当然是有的,一个规范化经营的租赁市场,一个可以为我们的生活创造真正价值的平台——租客网。4年多来,租客网参与并见证了中国租赁市场的各类风波与制度,是国内最早提出“租房免押金,不收中介费”,全新全意为租客考虑,并率先抓住市场痛点采取措施,解决广大租客在租房过程中面临的问题:针对租客安全问题,开发安全机制,为租客小时安全系统;对真假房源的混乱现象,采用严格审核房源信息的机制;以出租秒下架,防止重复租房的乱象发生……有许多人疑惑,租客网究竟拥有何种实力,可以这样大手笔的提出“不收中介费”,并提出可以帮助租客改变一种生活方式?如果深入了解过租客网的人就知道,租客网的“福利”不止于此,租客网是一家以互联网+为主导、以提供多元化共享生活方式为宗旨,以租赁托管为主营业务的大型综合房屋租赁平台。其功能自然也并不局限于租房,甚至可以租赁物品、领取“吃喝玩乐游娱购”线下实体店优惠券,功能板块设计租客的方方面面,为租客提供实际、有效的综合服务。而租客网的“租房”之所以被众人熟知,并成为租客网运作关键之一,依靠的是它的合伙人机制,这一机制也让其获取了极具竞争力的房源和房价。合伙人机制主要通过“转发房源信息赚佣金”,连接租客与房东,一方面实现零空置,一方面将闲暇时间变成赚钱的兼职。这就是租客网打造的“共享”长租平台,它撮合全量社会房源、满足租赁双方全流程业务办理,更为全社会提供了全新的住房租赁生态。

2021年04月06日 09:39

详解如何实现百度霸屏玩法

百度霸屏引流现在常规的操作套路大部分都是挖掘关键词铺文章,核心就是拼文章内容,文章数量和平台,平台有了,文章有了,内容不行,上首页也很难转化,还是要在内容上多下功夫。百度霸屏就这几个操作步骤,当然也就这几个步骤,再多也没什么了,简单看下哈:第一点:选择高权重平台并注册第二点:挖掘大量长尾词第三点:准备原创或伪原创诱饵文章第四点:组合标题、组合文章,发平台第五点:查询是否有收录,然后大批量作业差不多这些吧,主要还是研究下怎么在平台上能加上微信和电话等联系方式,不然发不上微信等于白发了,除非用品牌词引导搜索。这五点可以说是全部步骤了,再多的话,就是狗皮膏药了,还不如把这五个给掌握了。我们逐一的说下:第一点:选择高权重平台并注册选择平台很重要,因为要排名也要收录,还得要微信能带。目前不错的平台,B2B类型的、分类信息网类型的、新媒体类型的,博客类型的等等。如果说最佳合适的高权重平台,我是推荐大家做百姓网、新浪博客、简书网、贴吧、知乎、搜狐号。当然,你可以花点小钱发新闻源,新闻源排名效果很好,而且很权威。如果想免费,可以看我上面写的这几个最佳平台。平台选择好了,剩下的我们要注册账号,注册账号我说下,很多听过我课程的的学员都说我的方法一成不变,都是批量上账号去做。没办法,这是亘古不变的道理,只有批量矩阵才能做出最佳的引流效果,所以我每个平台都做批量账号矩阵引流玩法。如果单纯的一个账号,根本没法做出你预期所想的效果,我相信做过百度引流的应该都知道哈。反正我是建议大家矩阵引流。还有一点:如果自己没这么多手机号的话,就需要找成品渠道直接买来,然后直接发文章,这样能节省很多时间的。别因为那点小钱,让自己干苦力活。第二点:挖掘大量长尾词挖词,很简单,用软件就能实现,比如金花站长工具,我习惯用这个,挖词效率还是不错的。还有5118不错,但是太专业,不太适合我们用,不如金花挖的更直接。所以,你们要想大量做你们行业的词,就得去大量挖掘长尾词,有了词,就可以走遍天下,打败同行无敌手。挖词很简单,我就不多说了,需要软件的,百度下就有。第三点:准备原创或伪原创诱饵文章一般做百度霸屏培训的,都会让你拼凑行业文章,然后加上客户反馈图、购买图、好评图等,其实这种很烂的。我教大家一招,挖掘小红书同行笔记,当然,这个并不适合所有行业,如果小红书上没有这行业的笔记,那肯定不行。小红书上的笔记大部分都是经验心得类型的笔记,都是写的客户从对你不了解、到买、到用,最后有效果,这种可以产生共鸣的文案效果很OK的。你拿到手,需要去修改或者让员工或兼职伪原创,这个在于看你怎么做了,我只提供这个思路给你。第四点:组合标题、确定内容,发平台文章也有了,长尾词也有了,平台也注册好了,剩下的就是发布了。怎么发布?很简单,长尾词组合到一起,比如某某价格多少,某某价格贵吗,某某价格真的很贵吗?这里都带着价格,也就是你把挖掘来的长尾词都整理下,可以用关键词分词工具去分下词,把带价格的,带功效的,带效果的,这类的字眼的长尾词都整合到一个表格里,下次拿出来当标题。如果都是用价格的长尾词做标题,那排名很速度的,第二天就能见到首页前三了。当然,看你发的什么平台,百姓网速度是最快的。内容这块,就用经验心得类型的软文,文章里也适当搭配着出单图、好评图等等内容,因为是客户写的反馈笔记,所以别人看完都是很相信的。说下加联系方式这块,比如百姓网,可以直接在在一段加微信,来个案例图:没什么难度,这样发就行,你可以参考同行,看看同行怎么发的,我们就怎么发,其实很简单,没什么难度的。第五点:查询是否有收录,然后大批量作业查询收录,很简单,很多人做完了,都不知道文章收没收录,是因为不会查询。可以把文章链接复制下来放百度搜索框里搜索下,就能看到是否被收录。剩下的就是批量放大,每天坚持发,千万别三天打鱼两天晒网,那样肯本没效果的。百度本身就是用户有问题去百度搜索问题然后找到答案,如果首页都是你的内容,那很容易被检索到。

2020年05月03日 18:59

影响蜘蛛抓取页面的因素都有哪些

seo一般有两个需要做:一个是站内优化,另一个是站外优化,这样效果才能更好!站内优化:关键字优化,内容优化,标签优化,标题标签优化,关键字和原始文章增加,这对SEO来说是十分必要的。站外优化:要做友联,外链的添加,针对站点里边的产品,服务,特征等进行优化操作。网站收录与百度蜘蛛有着直接的关系,我们平时主要是通过主动或被动的方式来吸引百度蜘蛛抓取网站页面。主动的方式就是通过站长平台的链接提交工具或其它插件,来将自己网站新的内容链接提交给搜索引擎。被动的方式是靠搜索引擎蜘蛛自己来爬取,来的时间不一定。百度蜘蛛有两个目标:一个是本网站生成的新网页,另一个是百度之前已抓取但需要更新的网页。影响百度蜘蛛抓取网站页面的因素有哪些1、robots协议设置:网站上线后roblts协议文件是搜索引擎第一个查看的文件,如果不小心设置错误禁止搜索引擎就会导致,搜索引擎蜘蛛无法抓取网站页面。2、内容质量此外,网站内容的质量也非常重要。如果蜘蛛在我们的网站上抓取了100,000条内容,并且只构建了100条或更少的内容,那么百度蜘蛛也会减少网站的抓取量。因为百度认为我们的网站质量很差,所以没有必要抓住更多。因此,我们特别提醒您在站点建设之初需要注意内容的质量,不要收集内容。这对网站的发展有潜在的隐患。3、服务器不稳定:服务器不稳定或者JS添加过多,就会导致网站加载速度变慢,甚至无法打开,严重影响用户体验,这种情况也会影响百度蜘蛛抓取网站页面的。4、网站安全对于中小型站点,由于缺乏安全技术意识和技术弱点,网站被篡改是很常见的。有几种常见的黑客攻击情况。一个是网站域名被黑客攻击,另一个是标题被篡改,另一个是页面中添加了很多黑链。对于一般网站,域名被劫持,即域名设置为301跳转,并跳转到指定的垃圾邮件网站。如果百度发现这种跳跃,那么你网站的抓取就会减少,甚至会减少惩罚。5、网站响应速度快①网页的大小将影响抓取。百度建议网页的大小不到1M,当然类似于新浪网这样的大型门户网站。②代码质量,机器性能和带宽。这些会影响抓取的质量。不用说,代码本身的质量也根据程序执行。您的代码质量差,难以阅读。蜘蛛自然不会浪费时间阅读。机器性能和带宽也是如此。服务器配置太差,带宽不足会导致蜘蛛抓取网站,这将严重影响蜘蛛的热情。6、具有相同ip的网站数量百度抓取是基于ip抓取的。例如,百度每天可以在ip上捕获2000w页面,并且该站点上有50W站点,因此将抓取平均站点数量。很少点。同时,你需要注意看同一个ip上是否有一个大站。如果有一个大站,那么分配很少的抓取数量将被大站带走。影响网站收录的因素是各方面的,在查找原因的时候可采用排查法,一项一项的查找,只有查找到了原因才能提升网站收录。同时提醒大家一点:搜索引擎的索引库是分级别的,网站内容被收录后,如果内容质量度高就会进入优质索引库,并给于优先展示,因此网站收录并不是量大就是好。

2020年03月14日 04:23