您好,欢迎访问这里是您的网站名称官网!
10年专注环保设备研发制造 环保设备系统设计\制作\安装一条龙服务
全国咨询热线:400-123-4567
当前位置: 首页 > 新闻中心 > 公司新闻

比某能扫描王好用还免费无广告!推荐!

作者:佚名 时间:2025-06-01 16:59:19 点击:

安利一个识别植物的软件,叫形色。

打开软件,正下方有一个拍照按钮,可以拍摄或者识别相册里的图片。

我随便识别一张收藏的图片


植物库里会有一些比较基本的信息,如果图片模糊的话会推荐多种植物供人参考,而且有一些植物定位分享的小功能,小清新软件一枚( ̄? ̄)喜欢就试试看吧~

谢邀谢邀?˙3˙(? ? ?)˙3˙?


本着有好东西一定要分享的精神,强推我的宝贝软件~


花伴侣啊!!!强推!我们生物狗出门必备!!

遇到不懂的花,只需随手一拍,基本都可以出来结果滴~~

中科院植物研究所出品,良心。

给你放几张图展示一下它的准确性(?> <?)


再补充几句,当你识别出来的结果有些不确定,就点左下角图标可以直接进入植物百科,把里边列着的性状对照一下,基本就可以得出结果啦~


就酱(?ò ? ó?)

因为3721死了。

如果现在我们用( /www.知乎.com/问题/268657421)这样的网址的话,可能扫一扫就不会那么普及了。英文网址和ID对于英语国家的人来说是多数是有意义的,所以即使很长,输入的时候也不太容易出现拼写错误。但是汉字天生的数据量大,不太方便数据库检索,所以对于我网友的ID身份标注就出现了QQ号这样的数字系统,微信号也一样,只支持数字+英文,不支持中文。

原则上讲,发起一笔支付,或添加一个好友,我们其实只需要知道对方的ID号就可以执行。但是问题来了,对于英文不好或上了年纪的用户来说,英文+数字的微信号/淘宝ID简直就是个悲剧,你是愿意输入一串对你来说没意义还容易分不清l/I的乱码(这里我打的是小写L/和大写i,分不太清楚吧),还是愿意打开摄像头自动输入ID呢?当涉及到转账时,用户最大的担心,就是资金汇入了错误的账户,此时用户显而易见的更倾向于二维码。反过来在信用卡交易中,用户就不太介意输入16位的信用卡号码,因为输错了最多也就是没扣到或者扣了别人的钱,与自己无关,当然这是纯数字的情况下,遇到的阻力还不大,一旦混入随机的字母编码,用户可能当场掀桌给你看。

那么为什么国外也渐渐开始兴起使用二维码的风潮呢?这是因为二维码可以承载的信息远远大于普通字母编码,而使用摄像头读取的效率又远远高于字母编码。比如3DS上著名的Ninjhax就是使用二维码图片配合3Ds的摄像头输入程序,完成越狱的。

又比如,手机原件上区分原件的识别码,都开始使用二维码标注,这也是因为原件表面积太小,印刷普通字母容易造成机器视觉设备无法识别。

但是二维码有一个天然劣势,相比普通字母码,二维码是只有机器可以读的,离开了读取设备,你完全不知道印的是个啥,这就导致了付款码被替换这样的案例出现,除非你有意甄别,不然你完全无法发现二维码已经被篡改。


套哥按:让你见识下什么叫狂拽酷炫吊炸天!
投资理财怕套路
套哥指路你致富
各位好。今天来聊一聊“码链”。
日前,一位套友就留言让套哥扒一下这个“码链”到底是个啥玩意。

这“码链”到底是什么鬼呢?
这位套友问得套哥一愣一愣。
难道,区块链技术已经革新改名叫码链了吗?
吓得套哥赶紧找资料来研究了一下。
发现这个“码链”来头还不小。

(图片来源网络)
看到这篇报道,是不是觉得这个“码链”很高大上?
又是“联合国”,又是“将取代现行流通的美元、欧元、人民币”。
套哥发现,这个“研究院”的负责人来头更大。

(图片来源网络)
这位“徐院长”宣称是“二维码扫一扫的专利技术发明人”,拥有多个国家的知识产权。
难道,现在咱们用微信支付宝等扫一扫带来的便利,全拜这位“徐院长”所赐?
可是,这么牛哔哄哄的人物,套哥却在百科找不到其介绍。

(图片来源网络)
不过,套哥倒是找到了一条2015年的消息:

(图片来源网络)
当年,这位“徐院长”的头衔还不是什么“二维码扫一扫发明人”,而是什么某某网站的创办人。
当年介绍他为“感动芯”的创造者。

(图片来源网络)
才过了几年,他就摇身一变成为了“二维码扫一扫发明人”。
牛哔啊!
然而,套哥找遍网络,却找不到这个专利技术的证明,反倒是找到了一份“采用条形码图样进行通讯之方法,装置及其移动终端”的专利证书,且专利权是2017年才开始生效。

(图片来源网络)
可是,这“条形码”和“二维码”是完全不一样的啊。
由于“徐院长”顶着“二维码扫一扫发明人”的光环,旗下的会员在宣传的时候,更是牛皮吹上了天!

(图片来源网络)
这位网友可能太激动了,把“码链”写错成“玛莲”。

(图文无关)
在宣传码链的时候,那些会员更是会用到一些划破天际的文字,大家来感受一下。

(图片来源网络)
有没有被上面这段话给震惊到?
反正有很多人被忽悠洗脑成功了。

(图片来源网络)
好吧,通过这一些列的调查,套哥基本可以确定:这个“码链”,就是一个披着各种虚假外衣的骗局而已
套哥了解到,这个所谓的码链技术,仅仅是二维码的堆叠,简单来说就是把每个商品,每个人,每个店写一个标签,使用互联网搭建一个平台,让商品、人、商店在这个平台里进行交易,无非原来你是到商店里直接拿东西去柜台扫码付款,现在不用到商店,直接就可以自己扫标签付款。
从经济学上来说,真正能够增值的不是二维码或它宣称所谓的原始码本身,而是真正的商品在市场流通中供求的变化,以及对于未来供求预期在价格上的反应而已。

(图片来源网络)
这个“码链”正在密锣紧鼓准备上线,到时又会有一大批投资者拿着钱加入,做着一夜暴富的美梦。
这个平台能走多远?
拭目以待
以上~

不是,在马尔代夫酒店前台,下载APP的页面也是二维码(AppStore和GooglePlay),线下与线上结合方案里二维码是很有优势的。而且二维码本身不也是外国发明的吗……

感觉外国二维码没有那么常用的唯一原因是移动互联网,尤其是O2O还没有那么发达吧。

反对某个回答说外国人能记住网址,能记住个P,能记住还发明个毛线的收藏夹啊……只是没有线上线下联动的时候,可以直接给用户显示一个能点的超链接而已。

因为中国用户都安装了一个扫码的应用,尽管他们装的时候不是主要用来扫码的。


这是问题的关键,如果为了扫码还需要额外安装一个应用,其用户体验就会大打折扣。而商家也不能确定用户是否拥有扫码的应用而不敢过分依赖二维码。

我们平常使用的QR码是日本发明的,在日本用途也很广,但是日本的移动互联网或者说互联网不如中国繁荣是另外一个故事。整体来说,二维码的流行程度在中国是高于其他国家的,这是由中国的社会条件所决定的,很大程度上是通过二维码支付推广到各个个人使用领域的。我也仅仅是因为cashback bonus的原因使用过Walmart Pay,其使用体验远逊于刷卡。

我们日常最常见的二维码有两种,一种是登机牌上常见的PDF417码,另一种是日常使用的QR码,和一维条码一起,主要都是用于标识、识别作用,在一般的生产中用途十分广泛。“扫一扫”归根结底是为了识别身份、账户、内容的标签。在手机摄像头和图像处理能力普及之后,有了利用手机扫描条码的技术基础,而二维码来作为标签要比传统的文字、号码、序列,能携带更多的信息,能精确地指向内容,不需要手工输入,这是二维码相比较传统标签的优势。手机毕竟是一个多媒体设备,图像处理仅仅是其功能之一,利用其他的形式同样可以实现这些功能,支付宝就推出过声波支付,手机厂商也推出了各种各样的xxPay,但是这两者都需要额外的设备。声波支付一般用在贩卖机上,而xxPay则需要新款的POS机,不像二维码可以做到不依赖电子设备,打印出来就可以供人使用。

在中国,一般用户使用二维码的目的无非是两种:支付时的身份验证和读取公开内容的标签。先说前者,去现金化是一个大的趋势,但是在信息技术发展之前,非电子的无现金交易具有很大的风险,面对数量庞大且零散的日常交易,所依赖的传统信用体系在中国并没有建立起来,并且已有的形式也比较落后。(例如中国信用卡批卡主要是看人的收入,而个人的履约的能力并不能反应这个人履约的意愿,比如身在美国的贾某某就远比我们一般人有钱得多。)后来随着电子技术的发展,基于信息技术的即时交易(美国和英国刷卡每笔transaction是有一段pending时间,这也算是一些旧的遗留,在中国是即时完成的)能够得以实现,随着时代进步,无现金交易在中国成为了大众的需求。信息技术扩散性很强,这就使得电子支付在各国遍地开花,基于不同的国情,结出了不同的果实。

在爆发出电子支付的需求时,中国的情况如何呢?金融业虽算不得发达但也形成了体系+个人银行账户高度普及(无现金支付的基础),通信设施完善+智能手机普及(电子移动支付的基础),信用体系建设落后(传统的无现金支付不成气候),仍以现金支付为主(小额的钱包账户成为主流),大型连锁商铺缺乏市场统治力(无力支付额外的设备成本),这一系列的条件决定了中国既不会像印度和尼日利亚那样普及短消息验证的支付方式(中国的运营商也搞过类似的产品),也不会像欧美普及contactless的POS机(中国的银联云闪付),二维码可以动态生成且即时验证(通信基础设施保证了交易双方的安全)的特点就十分适应中国的情况。对比日本和香港,它们更加流行使用交通卡来支付,这也是由其独特的社会环境决定的,而且在手机支付出现之前就占据了无现金支付的主导地位,后来者再难以撼动了。

其二,就获取内容而言,二维码的优势就更大了,作为公开发布的信息标签,不基于电子设备,比传统的字符标签信息量大,可以精确地指向内容,不再需要搜索这样的操作,这使得二维码作为内容标签在全世界都很流行。作为最常见的公开信息,广告通常最需要吸引人们去获取进一步的信息,特别是“关注XXX”这类。因为中国有着巨无霸的平台,而大部分商品类别都缺少具有统治力的品牌,使得即便是大品牌也会依赖于巨无霸平台来开展在线业务,所以平台网页会比官网更多地被浏览,这使得标签化更为流行。而在公共平台上,加上汉字要比字母复杂,所以直接输入文字tag来搜索会大幅增加复杂性,而二维码作为平台网页的标签更为合适。

正是由于中国在不同方面发展的不平衡,这才使得二维码这种形式成为了中国移动互联网的代表。如果中国那时候更加富裕一点,大型连锁商铺能够遍布到三四线城市,基于pos机的各种xxPay就会比现在流行得多;如果中国那时候再穷一些,没能普及智能手机,兴许短信支付又会成为主流。

====

补充一下个人对支付方式使用体验的要求:

收银机-收款设备联动:收银员不需要在收款设备上再输入一遍金额

顾客尽可能多地操作设备:顾客自己刷卡刷手机,不让收银员碰到我的卡片或者看见我的二维码

简便的安全验证流程:不把风险成本转化为操作上的繁琐,不签单不输密码,如果需要的话尽可能在手机上完成

尽可能少的等待时间:直接通过支付平台上完成支付,反面例子就是一些第三方平台整合了微信和支付宝(在一些规模不大的店面很常见),在使用过程中,它们的网页需要额外的加载时间

对比几种支付方式:

Apple Pay在中国需要在手机上输入密码,其他的体验基本都满足,普及度也很高(各种银行卡接触支付)。

传统的银行卡和pos机让人有一种面对实物的踏实感,这方面仅次于现金。在支付过程中小额免密免签也提升了使用体验,但是在中国小额仅限于接触支付,刷卡时要额外操作,对收银员需要培训。一般情况下,美国超市和快餐店有免签额度(50美元),其他一般都要签字(个人很喜欢签字的仪式感),英国不论额度都需要密码,但是不用签字,中国需要输完密码之后签字,最麻烦。

圈存卡没用过,但就大学饭卡而言,如果扩大到不仅限于校园,使用体验应该还不错。

微信相比于支付宝,由于其并非专业的支付软件,很多菜单藏得很深,使用不便。由于存在路径依赖,二维码在很长一段时间将占据主导地位。个人认为国内二维码支付需要改进的方面在于:统一各个平台的二维码规格,手机厂商支持原生的二维码生成,手机直接打开一个列表,选择支付平台就弹出二维码,不再需要打开app再生成二维码,手机自带的相机扫码直接弹出对应的支付页面。平心而论,支付软件和平台的通讯时间和pos机验证时间差不多,但是网页加载会比等待approved会带来更多的焦虑感,如果是通过第三方的支付平台(支持多个平台的二维码)支付,由于其要额外加载网页,会带来更长的尴尬时间。

当然最方便的还是在熟悉的店里面直接刷脸。

因为支付宝和微信的装机量太大,所以人们完全不用担心对方的手机识别不了二维码。

但这种情况也造成了什么地方都敢给你放个二维码,而且只有二维码。比如在网页中给你冷不丁来一个:扫码查看更多内容。这让我怎么扫?你能看到自己的后脑勺?没有两块镜子我可办不到。

每次遇到这种情况我都得“保存图片”>>“打开微信”>>“扫一扫”>>“从相册”,然后在微信里打开了一个第三方网址。

就不能直接写个超链接(摔

以下内容为葵花扫码kuihuasaoma.com)原创,转载请注明出处,要不然走法律程序维权。

先给到答案,否定的。

其次必须再次强调,微信扫条码显示不了信息和真假货没有任何联系!

这个是消费者的知识误区,微信扫条码展示不了信息仅可代表,微信没有收录此款商品的信息。决不代表此款商品是假货,或存在任何质量问题。

实际在正式的工业生产过程中,同一种商品都是公用一个条形码,也就说我们看到这个商品条码也许会被用于亿为单位的商品上面。而且商品条形码的生成规则并不复杂,任何有基础条码知识的人都可轻易的复制出来一样的条码。

另外除去厂家自主管理条码外,目前微信可主动收录条码的渠道有中国物品编码中心和电商平台(现阶段泛指京东自营)。在上述平台有数据的话 ,均可被微信收录基础信息。

如图所示微信收录结果

今天浪漫周末,就不发别人悲伤的故事了,当然,成功的逆袭故事也不发,那些毕竟都别人的。

讲个日常小细节,但却是影响深远的大事,有时甚至可以避免一生的后悔。


开始前,看下前面文章(毕业3年,在合肥,女友让我去上海,不然分手!真是纠结死......)这位小伙子,如下是头条号网友的建议。

结果,一半以上的人(51%)支持他回上海,支持继续待在老家所在省会的占28%,此外,剩余的人(20%)建议直接分手。

下图,则是职场蛙同名公众号这一天来的投票建议:68%鼓励他回上海,12%支持他继续待在老家省会,此外,剩余的人(18%)建议直接分手。

  • 公众号好友的选择相比于今日头条受众,更支持回一线城市(51%上升到68%);
  • 建议直接分手的比例,超过了支持留在合肥的(20:28变成了18:12),;
  • 此两点相对说明,公众号好友更喜欢大城市,此外,当今爱很难而恨却更容易

好的,回来。

我们日常工作和生活中,经常碰到“微信扫一扫加个好友”这种事。不必多说,这已经是日常生活的基础知识,不用我教你了。这里有个环节:“是你扫我还是我扫你?”一般都会说“随便”“都行”“我来扫你”“你扫我吧!”

比如我,微信诞生后,我已经做外企部门经理了,也时不时有人要加个微信什么的,尤其是来自供应商的人,左一个右一个。有时,一家小供应商从他们的老板一直到项目工程师,都要求加好友。加就加呗,我一般都会让对方扫我的二维码

为何如此呢?

因为对方扫我,会出现如下这样的界面,我可以选择“接受”,也可以现场先不接受,即使以后这个“接受”过期了,我届时想起来,还可以继续联系TA。并且,对方扫你,或者加你好友,很多会注明来历,这就多了个参照,将来还可以到“新的朋友”这里来查下,看当初对方加好友的理由和日期等信息。你这掌握了主动权啊!

如果反过来,则没有这个记录。

我之前在天涯论坛写些文章,也做过版主,去年在头条、公众号、知乎也开始分享一些经验,加好友的人就更多了,至今每天平均10个人。

你知道的,一个微信号最多只能加5千个好友,你也得节约和善用自己的资源,不能随随便便的好友申请都加。在对方说“你扫我还是我扫你”时,我一般都回答“你扫我”,然后迅速展示下自己的二维码。

你以后也可以这么来,这实际上也是一种筛选的方法

你看这个“王慧”,明显就是个小广告,这就不能加。

成功在于细节。

正常一个人在用微信时,直接点击右上角的“+”号,只一步,TA就能扫一扫了。更何况,每天用这个“扫一扫”可能都很多次,扫下路边小黄车,小摊买个东西,吃饭付款等等,不要太熟练。

但是,找到自己的微信二维码,则需要有这样一个漫长过程:

打开微信→点击右下角“我”→点开最上方的“个人信息”→找到“二维码名片”→点击

这个过程,比“扫一扫”多了好几步。即使你每天用微信,但能想起来这个找到自己二维码的过程并熟练操作的,不多。你想想看,你直接让人扫一扫,找二维码的繁琐流程自己来搞定,这不是更礼貌

有时,你们老同事路上碰到了,或者某一个熟人在电梯中匆匆一面,准备加好友。因为时间匆忙,结果没来得及加好友,就因为这几秒钟。下次再能碰到这个朋友或者取得联系,可能已经是几年后了,甚至永远没碰到,尽管你们就在同一个城市,还住得很近,但你们是朋友却未能进入彼此的朋友圈。

这里的细节大家记住,扫一扫只要2秒钟,而正常一个人突然让他或她找到自己的二维码,得20-30秒。所以,你让对方扫你,也是一种节约时间,往大了说,叫做珍惜生命。

再继续,假如这朋友是你的客户,你是不是错失了一次跟对方加好友的机会?

我就在2014年也陆续开了仨小公司,此时,我这采购变成了销售。销售你得主动啊,一个客户,谈得不错。加好友,等对方二维码找出来后,我扫下TA。结果第二天TA也没通过我的好友请求,也许TA将我忘了,再过几天这“加好友申请”也过期了,这码事就算结束,一笔不错的订单,就这么错失了良机。反之,你让对方扫你,这就没问题了。无论理论还是实际来说,让对方扫你也是一种增收的方法

小伙子小姑娘,都是相信缘分的,确实,缘分妙不可言。现在的男孩女孩,实际上也还是羞涩的,经常磨叽好久,才到了微信加好友这一步。比方说小伙子在地铁或者在街头蓦然回首,遇到了“一辈子的爱情”,总之,就是那种特别有眼缘的女孩,好不容易敢开口,对方答应加好友了,你觉得自己要主动,要扫下对方。

结果人家回去后,根本没通过你的好友,就这么错失了缘分。在25岁的他看来,这可是一辈子的事,一辈子的弯路。无奈,追悔莫及。你也别怪天公不作美,确实是你的智商捉急,在看到本文之前,你甚至都莫名所以。

这里也鼓励下害羞的小伙子小姑娘,我记得自己年轻时也害羞,但30岁之后,就没那么扭捏了。我见到帅哥还是美女的,就直接上去,手机送到TA面前,直接一句“加个好友”。根据我目前的统计,十有八九对方是不会拒绝我,也就是高达90%的加好友成功率。所以,加个好友,扫下二维码,小伙子小姑娘,别害羞,尽管直接上。

总之,加好友时,一个小方式的变动,不但提供了一种筛选的方法,能让你善用自己的资源,掌握了主动权,并且显得你很有礼貌,还节约了彼此的时间,同时能增加收入,最后还挽救了你一辈子的缘分......好处大大的!

明白了吧?!下次再碰到“是你扫我还是我扫你”时,你可以直接回答“你扫我!

(大家也可以联系职场蛙公众号hoppings,探讨你的未来。)

现在人工智能发展很快了,扫一扫测脸型,就像扫描二维码一样简单!还能依据脸型匹配发型。

步骤:

1. 在安卓或苹果商店搜“发型美美哒”;

2. 直接进首页,仅点击相机图标,其他图标不要点;

3. 最好正脸拍照,撩起刘海,光线不要太暗,【就当自己在拍证件照】;

4. 有五种脸型,其中图标为全黑色的就是你的脸型






微信扫码已经深入人心, 微信扫物 12.23 日 ios 版本正式上线,从识别特定编码形态的图片(二维码/小程序码/条形码/扫翻译),到精准识别自然场景中商品图片(鞋子/箱包/美妆/服装/家电/玩具/图书/食品/珠宝/家具/其他商品),有哪些难点需要去克服? 扫物以图片(视频)作为媒介,聚合微信内部有价值的生态内容如电商,百科,资讯进行展示, 会催生哪些新的落地场景?本文将细细道来.

扫一扫识物是指以图片或者视频(商品图:鞋子/箱包/美妆/服装/家电/玩具/图书/食品/珠宝/家具/其他商品)作为输入媒介来挖掘微信内容生态中有价值的信息(电商+百科+资讯,如图 1 所示),并展示给用户。这里我们基本覆盖了微信全量优质小程序电商涵盖上亿商品 SKU,可以支持用户货比 N 家并直接下单购买,百科和资讯则是聚合了微信内的搜一搜、搜狗、百度等头部媒体,向用户展示和分享与该拍摄商品相关的资讯内容。

百闻不如一试,欢迎大家更新 ios 新版本微信 → 扫一扫 → 识物自行体验,也欢迎大家通过识物界面中的反馈按键向我们提交体验反馈。图 2 即为扫物实拍展示。

视频 1

图 2. 扫一扫识物实拍展示

扫一扫识物的目的是开辟一个用户直达微信内部生态内容的一个新窗口,该窗口以用户扫图片的形式作为输入,以微信生态内容中的百科、资讯、电商作为展示页提供给用户。除了用户非常熟悉的扫操作,后续我们会进一步拓展长按识图操作,将扫一扫识物打造成用户更加触手可及的运用。扫一扫识物的落地场景如下图所示,主要涵盖 3 大部分:

a.科普知识。用户通过扫物体既可以获得微信生态中关于该物体相关的百科、资讯等小常识或者趣闻,帮助用户更好的了解该物体;

b.购物场景。同款搜索功能支持用户对于见到的喜爱商品立即检索到微信小程序电商中的同款商品,支持用户扫即购;

c.广告场景。扫一扫识物可以辅助公众号文章、视频更好的理解里面嵌入的图片信息,从而更好的投放匹配的广告,提升点击率。

对于扫一扫,大家耳熟能详的应该是扫二维码、扫小程序码,扫条形码,扫翻译。无论是各种形态的码还是文本字符,都可以将其认为是一种特定编码形态的图片,而识物则是识别自然场景图片,对于扫一扫家族来说是一个质的飞跃,我们希望从识物开始,进一步拓展扫一扫对自然场景图片的理解能力,比如扫酒,扫车,扫植物,扫人脸等等服务,如下图 3 所示。

下面我们为大家重点介绍扫一扫识物的完整技术实现方案,图 4 展示的是扫一扫的整体框架示意图。该框架主要包含 4 大部分:

1)用户请求环节;

2)商检离线入库环节;

3)同款检索+资讯百科获取环节;

4)模型训练部署环节。

四大环节抽取核心技术模块可以总结为三个,即为数据构建、算法研发、平台建设,我们将一一道来。

数据构建

AI 时代数据为王,数据构建的目的就是为了更好的服务于 AI 算法,比如对于用户请求图、商家入库图都需要进行主体检测、类目预测、特征提取,都需要有高质量的训练数据来支撑检测模型、分类模型以及检索模型。一言以蔽之,数据决定了整个扫一扫识物性能上限。

算法研发

算法研发是为了充分的利用已有的数据,为识物的每一个环节如检测、类目预测,检索特征提取都在精度、速度上到达最优的折中,从而实现用户任意商品请求都能获得精准的同款召回,以及更加相关的资讯展示。算法研发的好坏决定了扫一扫识物的性能下限。

平台建设

无论是数据建设,算法研发,模型上线都离不开一个好的平台支持,我们为扫一扫识物从数据清洗,模型训练,部署,上线打造了一个完整的平台。可以说,平台建设关乎研发效率,决定了扫一扫识物能否实现上线。

扫一扫识物数据构建分为两大块,一大块是用于模型训练的训练数据建设,另一大块则是支撑用户任意商品检索请求的线上检索库构建。

模型训练数据库构建 训练数据库主要是支援模型训练,如同款检索中需要的物体检测模型,类目预测模型以及同款检索模型等,在百科资讯搜索中则需要训练商品标题文本分类模型,命名实体识别模型等。本篇文章我们重点关注视觉语义这一块的算法策略,对于百科资讯用到 NLP 算法我们在下一篇文章中详细阐述。2.3 章节中我们将阐述数据构建中用到的图片去重,检测数据库标注用到的半监督学习算法,以及检索数据构建提出的半自动同款去噪+合并算法。

在线检索数据库构建 在线检索数据库的覆盖范围至关重要,决定了能否支持用户的任意商品搜索请求。我们采用定向导入、长尾加爬、访问重放、主动发现四种策略不断扩展我们的商家图规模,目前已覆盖 95%+常见商品。这一数字还在不断上涨中,我们希望后续对用户的任意商品请求都能够精确召回同款商品。

无论是检测数据库还是检索数据库,第一步都是清理掉重复图片,这样既可以降低存储压力,也能够降低模型训练压力。常用的图片去重算法有如下 2 种:

1)MD5 去重,去除完全相同的图片;

2)哈希去重,除完全重复图外,还能去除在原图上进行了些简单加工的图片,如改变原图的亮度、尺度、对比度、边沿锐化、模糊、色度以及旋转角度,这些图片保留意义也不大,因为在模型训练中采用数据增强策略可以覆盖到。常用的哈希去重主要有 aHash,dHash,pHash 等,详细理解可以参阅相关文章[1,2],我们重点对比各个去重算法的速度和鲁棒性,如下图 6 所示。

对比图 6 中的数字可知,dHash 的去重速度最快,因为只需要计算临近像素的亮度差异,非常简单易处理,而且对于图片简单的 ps 操作具有较好的容忍程度,除图片旋转外,诸如亮度、尺度、对比度、边沿锐化、模糊、色度等较小改变都具有很好的抗干扰能力,有助于我们清理更多的无效图片。最终我们也是采用 dHash 对我们训练库进行去重操作,11 类全量爬虫商品库中,大概清理掉了 30%的重复图片,累计有 300w 左右。

从图 4 展示的整体框架可知,扫一扫识物的首要步骤就是主体检测,即先定位用户感兴趣的区域,去除掉背景对后续环节的干扰。主体检测基本是大部分以图搜图产品的公认首要操作,如下图 7 所示的阿里的拍立淘,百度的拍照识图,以及微软的识花小程序。当然主体检测的算法各有差异,如拍立淘采用的是物体检测算法,百度识图采用的是显著性区域预测,微软识花需要用户配合定位。为了解放用户,我们希望算法能够自动定位商品区域,考虑到显著性区域预测很难处理多个商品出现在视野的情况,类似拍立淘,我们采用更加精确的物体检测算法来定位商品位置,并选择置信度最高的商品进行后续的商品检索以及资讯百科展示。

当然物体检测模型离不开检测数据库的支撑,这里我们对比三种标注物体 boundbox 位置和类别的方法,即人工检测标注,弱监督检测标注以及半监督学习检测标注。

人工检测标注常用的人工检测标注工具 labelimg 如下图所示,我们需要标注爬虫的商品库中 11 类商品出现的位置以及对应的类别标签。考虑到人工标注的时间和金钱成本都非常巨大,我们只采用该策略标注少量的样本,更多的采用后续的算法进行自动检测框标注。

弱监督检测标注该算法的核心思想是标注图片中所含物体的类别相比标注框+类别的时间成本要低很多,如何只利用全图类别信息来自动推断物体的位置信息,从而完成自动检测标注呢?学术界和工业界有大量的研究者对这一方向进行了研究和探索,主要思路都是挖掘图片中的局部显著性区域,用其来表征全图的类别语义信息,如图 9 列举了几篇代表性文章。图 9 左下角算法重点阐述下,它是业内第一篇用深度学习来做弱监督检测的文章,实验室师兄研发,我们还基于该算法参加过 ImageNet14 的竞赛,拿了一个小分支的冠军。尽管愿景很美好,弱监督检测算法有个严重的缺陷,就是很容易拟合到局部区域,比如从大量猫的图片中拟合到的位置是猫脸区域,而很难定位到完整的猫的位置,这对于我们同款商品检索来说是难于接受的,我们需要精确召回同一款商品(细粒度检索),所有信息量都非常重要,因而该算法基本被我们 pass 掉了。

半监督检测标注相比弱监督检测算法,半监督检测算法更加贴近任务本身:基于少量的人工标注检测框+检测开源数据库初始化检测模型,然后用该模型去自动标注剩下的商品数据库,并用增加的标注来重新更新检测模型,之后迭代进行模型更新和自动标注。当然为了控制上述环节持续正向激励,我们为对置信度较低的标注样本进行人工校正,算法示意图如下所示。基于该算法,我们完成了整个商品检测数据库的标注,11 类全量商品库标注了上百万个检测框,其中人工启动标注只有十几万,其他的基本都是基于算法自动标注,大大节省了标注的时间和金钱成本。

完成了图片去重和主体检测之后,大家一个自然的想法就是,能否直接用这批抠图后的商品图结合 SKU 货号进行检索模型的训练,答案是否定的,抠图之后的商品图还存在两大问题:1.同款噪声问题,即同一个 SKU 下面存在非同款的图片,这可能是由于用户上传错误图片、商家展示的是局部细节图、检测抠图错误等因素导致;2.同款合并问题,不同的 SKU 可能对应的是同一个款式商品,不加以合并,会导致分类类别数目急剧膨胀,而且模型难于收敛。因此,在训练检索模型之前,我们需要完成同款去噪和同款合并两个环节,我们提出了基于自动聚类的同款去噪算法和基于混淆分类矩阵的同款合并算法,如下图 11 所示。后续我们将分别对这个算法进行解析。

我们采用聚类算法来自动去除每个商品 SKU 中存在的噪声图片。我们研究了常用的聚类算法,如下图 12 所示,

关于这些算法的理论及实现流程,大家感兴趣可以参阅[7]。我们在图 13 中对上述聚类算法在常见指标上进行了对比分析,考虑到商品 SKU 聚类的特性,我们更加关注聚类算法的抗噪声能力,对不同 SKU 特征分布的适应性以及处理速度,综合分析实践后,我们选择了 DBSCAN 作为我们的聚类算法,并对其进行改造来更加适配商品的聚类去噪,我们称其为层次法 DBSCAN。

层次法 DBSCAN 主要分为两个环节,分别为 step1.寻找距离最紧致的最大类簇,以及 step2.重访噪声样本, 捞回同款困难样本,增加多样性。下面我简要介绍这两个步骤。

层次法 DBSCAN 步骤 1 该步骤的目的是挑选 SKU 中距离最紧致的最大类簇,因为 SKU 中的同款样本相对噪声样本分布更有规律,数目也一般会更多。算法示意图如下图 14 所示,我们邻域内最小样本数目设置为 2,将所有的核心点联通后,假设有多个类簇,我们选择数目最多的类簇作为我们挑选的商品图片,剩下的样本作为噪声样本。

图 15 展示了某个实际 SKU 的步骤一聚类效果,从中我们可以发现最大聚类由于控制的阈值很严格,样本分布很单一化,而在噪声中实际有一些误为噪声的困难正样本(用红圈示意)。这些困难的正样本对于提升检索模型的鲁棒性和泛化能力非常重要,因而我们需要把噪声中的困难正样本捞回到左边的最大类簇中来,即为步骤 2 完成的事情。

层次法 DBSCAN 步骤 2 为了将噪声样本中的困难正样本捞回,提升训练样本的丰富性,我们需要重访噪声样本,计算噪声样本和最大类簇的距离,并将满足阈值条件的近距离噪声样本重新分配给最大类簇,如下图 16 所示。

同款合并的目的是为了将不同 SKU 但是同一款式的商品进行合并,从而得到实际有效的款式类目。我们采用分类混淆矩阵来完整自动同款合并。基于合并前的数据我们可以训练初始分类模型,并计算任意两个 SKU 之间的混淆概率。混淆概率定义为 p_ij=c_ij/n_i,其中 p_ij 为第 i 类预测为第 j 类的混淆概率,c_ij 为模型将第 i 类预测为第 j 类的样本个数,n_i 为第 i 类样本的实际个数。某个 SKU 的混淆概率矩阵如下所示,可知,当两个 SKU 实际为同一个款式时,如图 17 左中类目 1 和 3,那么他们之间很难区分,混淆的概率就会偏大。通过设定合并同款的分数阈值,我们能够将同款 SKU 进行合并。实际操作过程中,我们采用下图右边的迭代步骤进行,即先采用高的阈值合并置信度最高的同款,然后更新优化分类模型,并降低阈值合并更多的同款 SKU,上述步骤迭代进行,直到没有同款 SKU 需要合并。

合并完同款之后,我们得到的训练检索数据库的规模如下图所示,总共为 7w+多类目,1kw+训练样本,相比目前主流的开源数据库如 ImageNet(1000 类,130w+)和 OpenImage(6000 类,900w+),在类别和数目上都要更加丰富。

2.2.3.2 成本收益

这里我们对采用算法进行同款去噪+同款合并,和采用纯人工清理进行对比在时间和金钱上都有巨大的收益提升,加快了整个项目的迭代速度。

兵马未动,粮草先行,上一章节我们已经讲述了如何备好粮草(清洗高质量的训练数据),那么这一章节自然而然就是亮兵器了(高效利用现有训练数据的算法模型)。按照扫一扫识物整体框架,我们重点介绍视觉同款搜索涉及到的三大模块,即为物体检测、类目预测和同款检索。

物体检测是扫一扫识物的第一个环节,我们需要有效的定位用户拍摄图片中的商品位置,剔除掉背景对后续同款检索的干扰。学术界和工业界对物体检测展开了大量的研究,如下图 18 所示,研究者从不同角度对检测算法进行优化,如从速度考虑分为 one-stage 和 two-stage 检测;从 anchor 出发分为 anchor-based、anchor-free、guided anchors,近期 anchor 又开始崛起,在性能上匹配 two-stage,速度上匹配 one-stage;还有从类别不平衡出发,不同尺度物体检测等等出发。

考虑商品检测中,主要重视三个问题:1.速度问题;2.检测标注类别不平衡;3.物体尺度变化差异大,综合这三个问题,我们选择图 19 中的 retinanet[8]作为我们的检测器。众所周知,retinanet 属于 one-stage 检测器,从原图出发直接回归物体的位置和类别,因而速度快,其次它采用金字塔架构,有效的适配多尺度物体检测,最后,retinanet 提出了 focal loss 可以有效的适应类别不平衡问题,以及样本难易问题。后续我们会采用 anchor-free 的策略进一步优化 retinanet 的 head 部分,进一步加速模型的检测速度,这里不展开介绍。

我们将 retinanet-resnet50fpn 和经典的单阶段检测器 yolov3,和两阶段检测器 faster-rcnn-resnet50-fpn 进行对比,如下表格 20 所示。评测数据采用的是外包采集的 7k 张图片,涵盖了 11 大类,对比表格结果可知,retinanet 在速度和精度上达到了很好的折中效果。后续我们会通过 tensorRT 进一步优化 retinanet 的前向速度,剧透下最快可以达到 80FPS。

类目预测是为了确定检测抠图中物体的类别,从而方便后续用指定类目的模型进行特征提取和同款索引。大家可能会有所疑虑,因为前面检测器已经识别出了商品的位置和类目,为何不直接用检测器的类目,而是要重新来过一次类目预测呢?原因如下图 21 所示:训练检测器的数据有限,而用户上传的图片可能千奇百怪,那么训练库未出现的子类很容易造成检测器分类错误,其次是类间混淆性也会带来分类错误。

那么该如何提升类目识别的精度呢?这里我们利用海量的线上检索库来提升类目预测的精度。即为我们将用户 query 在检索库中进行一次检索,查询最近邻的 top-20 所属的类目,结合检测器的预测类目,来重新加权投票得到物体的最终类目。最终,通过检测+检索,我们能极大提升类目预测的精度,将近 6 个点的提升。

同款检索是扫一扫识物的灵魂。不同于一般的以图搜图,只需要找出相似的图片即可,同款检索属于细粒度检索,需要检索出 query 的精确同款,比如华为 watch GT2 需要搜出来的就是该款手表,不能是其他牌子的手表,这就导致同款检索的挑战非常大,下图 22 列出了同款检索的难点与挑战:1.类间混淆性问题,即如何区分相似款和同款;2.同款召回问题,即同款本身存在较大差异,如何有效的检索出同款。考虑到这些难点,我们提出了 9 大方向来优化我们的同款检索模型。下面一一解释。

这是我们的 baseline 模型。我们使用的分类模型如下图 23 左侧所示。众所周知,分类模型采用 softmax 将逻辑值映射为类目的概率值,下图右上角表格所示,softmax 能很好的放大逻辑值的差异,将正确类目的概率逼近 1,有利于模型快速收敛。下图中我们还展示了 softmax 分类模型的决策边界,以及在 mnist-10 类目上学习得到的特征分布[9,10]。观察可知,softmax 分类器学习到的特征空间有 3 大特征:

1)特征空间呈现扇形分布,因而用余弦距离检索会优于欧式距离,后面我们会固定采用余弦距离进行同款检索;

2)不同类目分布不均衡。事实上我们希望同等重视各个类目,他们能均匀的分割整个特征空间,有利于模型泛化能力;

3)边界样本检索不准确,从特征图可知,边界样本距离临近类的余弦距离很可能小于该样本到同类之间的距离,造成检索错误。下面,我们重点修整分类模型的所存在的问题。

归一化包括两种,对图 23 中的分类权重 W 进行归一化,以及对特征 x 进行归一化。那么归一化的作用是什么呢?先来说说权重 W 的模长和特征空间分布不均衡的关系。有研究者[10]表明,训练数据库中样本多的类目对应的 W 的模长也会越长,表征模型越重视该类的分类正确程度,而忽视了其他样本数目少的类目,如图 24 所示,MNIST 和 WebFace 两个数据库都验证了上述的映射关系。而实际上我们希望的是每一类都能被平等的重视,特征空间中每一类能够均衡的划分整个空间,因而我们需要对 W 进行归一化,让所有类别的权重一致,即

特征归一化的操作类似,即为:

回顾 softmax 分类的决策边界:

我们将 W 和 x 都进行归一化,因而决策边界只取决于角度,迫使模型训练收敛后特征分布更加扇形化,有利于余弦检索。但是两者同时归一化,会造成模型难于收敛,大家可以思考一番为何?参考图 23 中的 softmax 特性,由于权重和特征都进行了归一化,分类逻辑值最大为 1,最小为-1,同样的三类分类学习中 gt 类目对应的 softmax 概率最大只到 0.78,远小于 1,导致模型仍有较大 loss,不好收敛。解决方法比价简单,对逻辑值乘以一个尺度值 s 即可,扩大差异化,有利于模型收敛。

增加角度 Margin 的核心目的是让 softmax 分类的扇形分布更加有利于检索:即为同类更加聚集,不同类更加远离。常见的 3 种增加角度 margin 的策略入下图 25 所示:乘性 margin[10,11],加性余弦 margin[12],加性角度 margin[13]。

增加 margin 后,softmax 分类模型得到的类内特征更加紧凑,如下图 26 所示。这里多说几句,相比乘性 margin,加性 margin 更加容易训练,这是因为乘性 margin 将余弦的单调区间从[0,π]缩小为[0,π/m],梯度更新区间变小了,而加性 margin 单调区间不变,有利于模型收敛。

分类模型的学习目的是类别可区分,和检索任务还是有一定区别,引入排序损失的目的就是显示的去优化检索任务,即为欧式空间中同类样本的距离要小于不同类。一般排序损失和分类损失叠加使用效果要更好,我们设计的模型结构如下图 27 所示:

图 27 中右边展示的是常用的排序损失函数,如 contrastive loss, triplet loss, lifted structure loss 等。图中重点展示了三元组损失函数以及优化的可视化目标,即同类距离要比不同类距离小于一个 margin。

此处我们对分类模型和其改进版本在商品检索任务上进行性能对比。评测集合是我们收集的 11 大类商品库,其中用户评论图作为查询样本,检索样本为同款商家图和非该款式的噪声集合组成,可以较好的模拟线上检索库。图 28 展示了分类模型及其改进版本在珠宝类目上的性能对比,可知:1)增加归一化和角度加性 margin 后,即为 ArcFace[13],检索性能要优于常用 softmax 分类模型;2)在分类模型基础上增加排序损失,如 Hard Triplet Loss,检索性能优于常用 softmax 分类模型;3)分类+归一化+角度 margin+排序,如最后两行所示,性能进一步提升,但是提升幅度不是特别大。

为了进一步提升检索模型的特征表达能力,我们探索让检索特征捕捉更加丰富的商品特性,如在款式的类别上,加上视角、品牌等商品属性,如下图 29 所示。

为了适应多属性标注标注的学习,我们设计如下图 30 的多任务协同学习模型。多任务协同学习模型的好处非常明显,可以更好的利用属性之间的相关性,有利于网络的优化收敛,以及提升模型的泛化能力,这样得到的检索特征更加有利于商品同款检索。这里有个问题,不同任务权重如何设计?当然我们可以手工设置每个任务的权重,但这需要对各个任务理解较为深入加上大

量调参得到,另外的策略是自动得到各个任务的权重,有许多研究者对此进行了研究,这里我们采用验证集趋势算法[14]来自动计算得到各个任务的权重,如下图 31 所示。该算法思想比较直接,即为人工设置高权重用于主任务,如款式分类,其他任务基于其优化难易程度来得到权重,如难优化(损失波动大且绝对值高)的任务权重大,易优化的权重小。使用多任务协同学习后,模

型的检索性能相比单任务模型有较大的提升,如下图 32 所示。

在图 22 中我们讲述了同款检索的一个巨大的挑战即为相似款对同款检索的混淆。为了更好的区分同款和相似款,我们希望更加关注一些显著的区域,如下图 33 中手表的 logo,刻写的文字,鞋子的 logo,花纹等。常用的注意力模型分为三种[15],有特

特征空间注意力,特征通道注意力,以及 2 种注意力相结合。通过实验对比可知,增加特征空间注意力后,模型检索性能提升,但是增加特征通道注意力,检索性能反而下降,如下图 34 所示。我们认为空间注意力有利于强化模型重视显著空间区域,而特征通道注意力可能造成了模型过拟合,性能反而有所下降。

同样针对同款检索的两大难点和挑战,即类间混淆性和类内差异性,我们采用层级困难感知模型来充分重视这两大难题,如下图 35 所示的包包。尽管是同款,其相似程度可能有很大差异,如该款式包包由于拍摄视角、遮挡等造成的变化,对于非同款的负样本,也有非常相似的其他款式包包,和差异比较大的其他商品入酒类、口红等。

层级困难感知模型模型[16]结构如下图 36 所示,其排序损失按层级分布,第一层级针对所有的正负样本进行排序学习,第二层负责较为困难的正负样本对,而第三层则负责更加困难的正负样本对,并且对于越困难的样本对,模型网络设计的越深。

层级困难感知模型通过层级设计,匹配正负样本对的层级分布特性,能够有效的提升模型的同款检索性能,如下图 37 的实验所示。

众所周知,一般竞赛中大家都会融合多个模型的结果来提升精度。但是在实际的项目落地,我们需要同时考虑部署模型的精度和速度,融合多个模型会占用更多计算资源,降低前向速度。那么怎么既然融合多个模型结构的优势,又不增加计算资源呢?这就是互学习模型的核心思想,如下图所示,互学习模型通过 KL 散度 loss 来吸收其他模型的结构优势,部署的时候只需要部署一个模型即可,不增加计算资源。

实验中,我们利用 resnet152 和 inceptionv4 进行互学习,实际部署采用 resnet152 进行检索,其性能如下图 39 所示。互学习除了增加模型训练时间,对模型上线不增加任何负担,但是精度能够较为显著的增加。

通过上述所有策略来提升模型的同款检索性能后,我们发现仍然存在一个问题,就是深度学习模型会过分关注图像的纹理区域,而忽视物体的形状。比如在行旅箱的同款检索中,返回的是印有相同图案的书包,钱包等,而非行旅箱。如何让模型在关注

纹理的同时,也关注下物体的形状信息呢?我们采用局部显著性擦除技术来破坏原图的纹理,迫使模型来关注物体的形状。常见的局部显著性擦除有 3 种,如下图 41 所示,分别为随机擦除,伯努利擦除,对抗擦除。这里我们重点对比了前两者,对抗擦除后

续有时间再补上其性能,实验结果如下图 42 所示,局部显著性擦除能够极大的提升模型的同款检索精度。

前面我们讲述的都是优化检索模型,这里我们讲述的是如何进一步优化检索模型的检索结果,即重排序。在重排序里面,我个人非常欣赏互 k 近邻算法[17],非常简单高效。互 k 学习算法最早被提出来用于行人再检索,如下图 43 所示,其核心发现是,对于 query 样本,其检索的 top-10 样本中,正样本(和 query 为同一人)换做查询样本时,其 k 近邻中有原始的 query 样本,而负样本(和 query 非同一个人),其 k 近邻中没有原始 query 样本,基于该发现,作者在马氏距离的基础上,增加了基于互 k 近邻的距离度量,如图中下方所示,基于该度量可以有效的对原排序进行重排序,将正样本挪前,将负样本挪后。

但是实际上,我们无法直接利用该算法用于商品同款检索,原因在于我们的 query 是用户评论图,而检索图是商家图,他们存在很大的差异,造成互 k 近邻会失效,后续我们重点是如何优化特征度量空间,让模型的域差异减小,然后再利用互 k 近邻来进行重排序。

最后,我们基于用户上传的 7k 张图片进行 11 类检测准确度评测, 运行环境 NVIDIA GPU P4,来对比不同竞品的精度差异。对比试验可知,我们的算法要优于京东,接近拍立淘。

正所谓磨刀不误砍柴工,平台建设对于我们的数据构建,模型学习,模型部署都是至关重要。下面我们一一介绍。

为了加快人工校验以及人工标注的速度,我们开发了一系列工具来辅助标注和检验模型精度,这里不做过多解释。

这几年,机器学习平台发展迅猛,很多公司拥有自己的深度学习平台,我们人少钱少,主要是基于开源的深度学习平台来开发符合商品同款检索的特有平台。我们主要是开发了 caffe 和 pytorch 两套同款检索平台,后续重点介绍。

我们开发的第一个模型训练平台是 caffe。caffe 平台的核心架构如下图 45 所示,caffe 平台现在主要是工业界用的多,现在学术界用的少些。我们开发的 caffe 同款检索平台,具有如下特点:

1)支持丰富的数据增广策略;2)支持多类型数据加载;3)支持蒸馏学习/互学习算法;4)支持困难感知模型算法;5)支持排序模型算法;6)支持 batchsize 扩充。

caffe 的优缺点非常明显,其优点有:1)训练快,结果稳定;2)基于 prototxt 快速试验各种多模型/多标签/多数据源任意组合。其缺点有:1)新算法开发慢;2)调试不灵活;3)显存优化不好;4)学术前沿方法更新少。第 4 个缺点是较为致命的,我们无法快速跟进学术前言,因而我们后续决定开发 pytorch 检索平台。

我们开发的 pytorch 检索架构如下图 46 所示,基本支持 caffe 检索平台的所有特点:1)支持丰富的数据增广策略;2)支持多类型数据加载;3)支持蒸馏学习/互学习算法;4)支持排序模型算法;5)支持更多主流网络 EfficientNet;6)支持数据去噪/合并同款/检索;7)支持混合精度训练。pytorch 优缺点也非常明显,其优点:1)自动求导,算法开发效率高;2)动态图,Python 编程,简单易用;3)Tensorboard 可视化方便;4)Github 资源多,紧跟前沿;5)Pytorch1.3 支持移动端部署。当然 pytorch 也不是完美无缺的,相比 caffe 有其缺点:1)在多任务自由组合不如 caffeprototxt 方便。

模型训练我们可以不在乎模型运行时间代价,但是在模型部署时候我们得要充分重视模型的资源占用情况,尽量提升模型的并发能力,如 GPU 部署时候优化显存,适配硬件,加快速度。这里我们重点介绍后台 GPU 部署使用的 tensorRT 和手机端部署使用的 ncnn。

tensorRT 是英伟达开发的部署平台,能够有效的降低模型显存,加速模型前向速度。这里我们不展开细节,大家可以关注下面的检测模型和检索模型,通过 tensorRT 量化加速后,显存和速度都有了巨大的飞跃。

移动端部署,我们用腾讯自己开发的 ncnn 架构,其优点如下图 49 左图所示,demo 如右图所示。

任务调动平台由我们的后台大神们开发,主要用于各个任务的有效调用,考虑到我们的检索库是上亿的数据库,需要保证平台具有较好的容错、容灾,以及鲁棒机制。如下图 50 所示,当然这里展示的只是冰山一角,后面等后台大神们在 KM 里给大家详细解释。

最后,我们对我们的扫一扫识物进行未来展望,还是那句话,我们期待扫一扫识物成为大家的一个生活习惯:扫一扫,知你所看;扫一扫,新生活,新姿势。

参考文献

[1]公司内部文档

[2]blog.csdn.net/Notzuonot

[3]Learning Deep Features for Discriminative Localization, CVPR16

[4]Weakly Supervised Object Localization with Latent Category Learning, ECCV14

[5]Weakly Supervised Deep Detection Networks, arXiv16

[6]Seed, Expand and Constrain: Three Principles for Weakly-Supervised Image
Segmentation, arXiv16

[7]scikit-learn.org/stable

[8]Focal Loss for Dense Object Detection, arXiv18

[9]https://zhuanlan.zhihu.com/p/76391405

[10]SphereFace: Deep Hypersphere Embedding for Face Recognition, arXiv18

[11]Large-Margin Softmax Loss for Convolutional Neural Networks, arXiv17

[12]CosFace: Large Margin Cosine Loss for Deep Face Recognition, arXiv18

[13]ArcFace: Additive Angular Margin Loss for Deep Face Recognition, arXiv18

[14]Adaptively Weighted Multi-task Deep Network for Person A!ribute
Classification, MM17

[15]Concurrent Spatial and Channel ‘Squeeze & Excitation’ in Fully
Convolutional Networks, arXiv18

[16]Hard-Aware Deeply Cascaded Embedding, ICCV17

[17]Re-ranking Person Re-identification with k-reciprocal Encoding, CVPR17

[18]公司内部文档



作者: breezecheng,腾讯 WXG 应用研究员

更多干货,尽在 腾讯技术

微信扫一扫识物是典型的“离线写,在线读”的业务,业务数据的存储和检索库的构建都是在离线环节完成。我们通过爬虫系统收录了小程序生态下的商品图片,下载后进行检测抠图,提取检索特征,最终构建成检索库交付到线上环境。这篇文章将主要介绍这一部分的工作。

识物是以图像或视频作为输入,用以挖掘微信生态下商品、物品等有价值等信息。这里我们基本覆盖了微信全量优质小程序电商,涵盖上亿商品SKU,聚合了微信内的搜一搜、搜狗等资讯,最终聚合后呈现给用户。百度识图和阿里拍立淘也是基于该技术发展而来。

工程上,识物工作主要可以分为三块,如图1所示:

  1. 算法模型

算法侧主要是对检测模型和多类目的检索模型等持续炼丹,检测模型需要返回图片中物品的准确位置;检索模型需要保证同款物品的特征表达越近越好。

  1. 离线工程

识物是典型的“离线写,在线读”的业务,业务数据的存储和检索库的构建都是在离线环节完成。我们通过爬虫系统收录了小程序生态下的商品图片,下载后进行检测抠图,提取检索特征,最终构建成检索库 交付到线上环境。这篇文章将主要介绍这一部分的工作

3.在线部署

算法模型和离线生成的检索库最终完成部署,对外服务。用户识物时,检索库会召回一批相似物品,再经过一系列复杂的精排、过滤逻辑,最终返回用户看到的结果。

数据版本主要分为两类,一是算法模型版本,我们有10+种业务模型,平均每周有2-3个模型迭代升级。二是检索库版本,在模型不迭代的情况下,每天有新数据的合并,即增量迭代;而每次算法模型变更,特征表达发生改变,需要根据新特征重新构建检索库,即全量迭代。

在高频的版本变更场景下,如何兼顾灵活性与安全性。

目前我们收录的图片数为10亿左右,平均每天新增1500w。除了图片数量多,任务的流程也很多,如图片下载、目标检测、特征提取等任务,每个任务每天都是千万级的数据处理量。

如何高效的处理数据,提升业务的迭代效率。

随着业务的发展,简单的业务流程已经不能满足我们日益复杂的业务需求。为了提升业务指标,我们可能还需要图片质量,文本语义,死链、下架商品的过滤等任务。

如何在流程日益变多的情况下,不导致整个系统的臃肿。

离线工程属于重流程的业务,数据从产生和落地将经历九九八十一环,任何一环出错都会导致结果有问题。发现问题的时间越晚,修复的成本越高,对业务的影响越难以估计。

如何科学的监控和管理数据质量,使系统有良好的可维护性。

这里有多种维度的数据版本,例如模型版本,特征版本,检索库版本等,上游环节的版本变更将引发后续环节的变更,最终都将导致检索库版本变更

在我们的业务场景下,检索库的迭代是高频操作,正常情况下每天会增量更新,而模型的变更又会引发检索库全量更新。数据量级上,我们的全量图像是亿级别的,按类目分库后每个类目也是千万级。

我们调研了业界内主要用于图像检索的技术,如图3所示。综合考虑后,我们选取了灵活性更强、相对内存占用更小的的faiss-ivf作为我们的索引库构建算法。

对于每天的增量数据,我们每天对每个类目(10+个类目)都会构造一个对应当天数据检索库。每个类目的全量检索库是由N天的检索库合并生成(faiss-ivf特性),2000w的数据合并仅需要4分钟。基于这样的设计,使得我们可以灵活的选取时间窗口的范围,如图3所示了窗口为2的合并方法。

这样的好处是,如果某天数据发现有问题,只需要修复当天数据后再进行合并即可;如果需要丢弃某些数据,如旧数据,合并时不选取即可。

前面我们讲到,模型变更最终都将引发检索库的全量迭代,这里的模型有检测模型和**检索特征模型。**新检索库上线时,本质上是新旧数据的过渡,一般实现新旧数据的切换都会设计复杂的系统来保证数据一致性。

2.2.1 检测模型变更

这种场景下的检索库变更,严格上来讲我们并没有实现新旧数据的一致性,我们只是通过简单的方法使得即使新旧数据同时存在也不影响用户的体验**。

这里主要涉及到如何构建我们的映射关系,我们为每次检测出的结果都赋予一个唯一的单调递增id。替换模型后,同一张图片的检测结果会变化。可能抠图的位置有变化、可能会扣取不同的物品、可能会扣取多个物品。

如图5所示,检索库v1里只有上衣,对应检索id为1;变更检测模型后,检索库v2可以同时检测出上衣和下衣,对应检索id为2,3。这样在线模块可以逐步更新检索库,线上同时存在新旧检索库也没有影响,如果请求落到旧库返回1,落到新库返回2,但最终都将返回正确的结果,结果上是一致的

2.2.2 检索特征模型变更

这种场景下的检索库变更则复杂许多,检索库存的特征来自于检索特征模型。检索模型变更后,同一个物品图片的特征表达完全不同,维度甚至也发生了变化,如图6所示。

我们需要同步变更检索特征模型服务新检索库,通过双buffer的方式实现新旧数据的共存,而且要实现严格的路由协议来保证同一个请求在同版本的特征检索服务和检索库中完成。

在开发过程中,算法需要交付各种模型给离线和在线,离线生成的检索库也需要交付给在线,数据版本的迭代也需要考虑版本的可回退性。为了解耦多方之间的依赖,且避免在同步过程中直接操作文件带来的风险,设计了一套数据版本管理系统。

如图7所示,资源发布者上传资源到该系统,并附带对应业务、版本号及md5。资源使用者只需要理解对应业务当前的版本号,版本管理系统会返回对应的资源文件。线上实际使用时,在线模块会定期轮训某业务对应数据版本文件的md5和本地文件md5是否一致,不一致则会拉取最新的文件,拉取完成后校验md5是否一致,最终实现更新。

在业务模型或检索库需要回退时,只需修改配置文件,重启服务即可。

目标检测、检索特征提取等是典型的图像深度学习任务,业界内有caffe、pytorch、tensorflow、tensorRT等多种深度学习框架,有的框架不能保证向上兼容。而我们负责炼丹的同学第一要务是追求效果指标,在尝试各种奇淫巧技时练出来的丹通常并不能和微信的线上环境很好的兼容。

简而言之,在重算法的工程系统中,不仅有业务代码的更新,还有工程环境的迭代。这非常适合使用docker来封装和迭代业务环境。 通过docker化部署,我们可以更方便的引入更多开源组件来支撑业务,也可以让我们在一些框架选型上更加灵活。

就我们自己的业务场景而言,我们还可以利用微信深度学习任务平台(yard)的计算资源,这部分属于公用资源,需要抢占式使用。yard也是docker化去执行任务。这为我们业务可以借助yard公用资源作为临时扩容worker节点做了很好的铺垫。

我们每天平均有1500w增量数据,全量为十亿级别的数据。单机必然无法满足处理的实效性,唯有分布式计算才能满足要求。

正如mapreduce,map阶段的工作我们需要对数据进行拆分。这里对拆分原则除了平均外,还考虑了拆分后到数据的运行时间。如果拆分太细GPU的运行效率会降低,拆分太粗会导致错误修复的时间成本变大。我们让每个拆分后的任务都尽量控制在1小时内完成,最终拆分的粒度为每个包10w左右。

拆分后的数据进行并行计算相当于reduce阶段,这里的重点是如何将拆分后的数据分发到多台机进行计算。此外,我们还希望公用资源空闲时可以非常灵活的进行扩容接入,提高并发处理能力。

我们结合zookeeper的分布式锁特性,实现了一套可靠分布式任务队列。worker采用拉模式拉取队列的任务。这样的优点是伸缩性好,可以灵活的增加和减少yard的机器资源。如图8,当新worker接入后,从队列中拉到任务直接执行,可以实现秒级的扩容。

对于我们的场景,任务需要被可靠消费,这里的可靠包含来两层含义。

第一是避免任务被重复消费,我们借助zookeeper的保活锁,锁通过心跳保持活性。如图9中第1,2时刻,worker拿到队列里的任务抢锁成功才可执行;如果出现机器宕机,如图9第三3时刻,锁会自动释放。

第二是完整消费,我们在task被完全消费结束后才删掉队列里的对应task,如时刻4的task2。时刻3由于机器宕机,task1并未被完整消费,因此依旧存在,后续可被继续消费。

理论上讲,我们的消费模式属于至少一次消费(at least once),极端情况下,如果worker执行完任务还没有回传状态时宕机,那任务仍处于未成功消费,仍可能被后续worker消费。这里需要保证任务的幂等性。

引入公用计算资源提升了我们的处理能力,但同时也给我们带来了一些小问题。例如,公用集群的机器配置比我们自己集群要好很多,为了使不同集群都能发挥最大的GPU性能,我们支持不同集群使用不同的全局参数配置。而且公用集群和文件系统不在同一个idc,导致网络IO时间过长,降低了GPU利用时间,我们在公用集群的同idc实现了一套文件预拉取系统,根据任务队列中存在的任务,提前同步待消费文件到同idc的文件缓存系统。

为了提高GPU利用率,我们还做了大量的工程优化,这里就不展开叙述了。基于分布式计算的框架,极大提升了我们的计算效率。拿计算效率最低的目标检测任务举例,目前我们集群的处理能力可达到5600w图/天,如果加上公用计算资源,可以达到1.2亿图/天(集群12台P4双卡,公用集群yard-g7a集群平均10个双卡,深度学习框架使用的tensorRT)。

虽然我们每天有1500w左右的原始图片,但最终符合录入检索库的商品仅有一半不到。因为为了确保检索数据的质量,我们会在多个维度做数据过滤。现在我们的图片从下载到建库一共会经历30+种中间任务,图10仅展示了主要的任务流程模型。

随着任务的增多,尤其是许多任务间存在着复杂的依赖关系,每个任务都不是一个独立的个体,每个任务的成败都将影响最终的结果。为了更好的管理每个任务的状态,梳理任务间的依赖,使得工程的复杂度不随任务变多而变大,我们自研了一套任务调度系统。

调度系统主要由以下几个部分组成:

  • 文件系统:文件系统这里使用了微信自研分布式文件存储系统的WFS,我们所有中间数据和结果数据都存放在这里
  • 存储系统:主要有任务存储和实例存储,与一般实例存储不同的是,为了分布式计算,我们在数据维度和类目维度做了拆分,一个实例包含一个或多个子实例
  • 调度系统:主要负责收集、管理任务状态,检查任务依赖
  • 触发器:定时轮训调度系统,找到满足执行条件的任务实例
  • 任务队列:存储待执行的任务实例,由worker获取依次消费

容灾性上,调度系统相关的模块均是多机多园区部署,只要不是某个模块完全挂掉,整套任务调度都可以正常执行。

对于每天的例行任务,实效性并不敏感,早几个小时或晚几个小时对业务影响不大。但GPU资源是是十分宝贵的,我们将部分GPU机器和在线GPU服务合并部署。结合在线流量屏蔽策略,实现高峰时期资源借给在线服务,低峰时期运行离线任务。

如图12所示,其为一台参与离线任务闲时调度的在线模块,我们拟定每天0点-7点的低峰时间为离线运行时间,7点-24点的高峰时间为在线模块服务时间。最大限度的利用了宝贵的机器资源。

前面做的工作保证了我们以任务为粒度的工程可靠性,但任务的成功并不能保证业务数据是完整的,如数据丢失、代码逻辑有问题等。为了监控数据维度上的业务质量,我们基于ELK搭建了一套数据系统,主要用于收集重要的基础数据、业务数据、运行结果等。

我们曾在几次版本迭代过程中,发现数据出错,但发现时已经付出了极高的时间代价。因此我们希望在任意时刻都能观察离线系统的运作是否正常,数据的流转是否符合预期。出现问题后可以及时干预修正,降低错误成本。

我们对涉及数据流转的核心任务都做了数据结果上报,这样子我们可以通过数据漏斗发现是否出现问题。这个问题在全量数据重跑的时候尤其重要。图13展示了项目中核心任务的数据情况。

上图看上去是每天任务级的数据监控,但实际上我们我们的设计是扩展到了**每次任务级(这里定义为planid),**既可以是每天,也可以是每次覆盖多天的重跑。 我们按图14的字段上报业务的运行结果,前4个字段组成联合唯一索引,planid作为区分每次运行的逻辑字段。这样即使同一个任务在不同时期运行结果是不同的,我们也能区分每一次运行后,真实的数据结果。这个设计在保证每次大版本数据迭代时,对于把控数据整体运行质量十分重要也十分有效。

5.2 一致性检查

数据可视化方便了我们检查问题,但是还不利于我们发现问题。我们还需要在数据出问题时,能及时告警、迅速修复。这最最重要的就是数据一致性,这里的一致性主要是一些核心任务的数据漏斗,输入和输出应该是一致的。图15中展示了一些存在关联的任务,带颜色线段代表数据存在关联性。

为了满足各种维度的统计、校验,同时又能快速支持新任务的检查。我们封装了核心的统计和校验逻辑,配置化告警任务,确保层层流程运转后的结果准确无误。

我们在对我们的检索库做比较大的版本迭代,或是线上策略有比较大调整时,直接灰度上线再观察曲线有时并不能及时发现问题,存在很大的隐患。基于这种情况,我们开发了自动化测试系统。我们提前收集和整理了部分带标签的数据样本,每次更新都需要在测试环境自动化评测一次,如图16所示。我们在结合具体指标分析此次迭代是否可以安全上线(关键数据打码)。

我们平均每天流入数据超过千万,数据膨胀的速度非常快,这给我们带来了极大的存储成本和迭代成本。但回顾业务本身,其实许多商品数据在随着时间的推进,将变成过期、死链、下架数据。最简单的做法就是使用窗口期来维护我们的数据,窗口外的数据自动淘汰,我们在faiss检索库选型时也是这样考虑的。

但是我们也想到,直接暴力的淘汰旧数据也会有个致命问题。对于我们的业务而言,什么数据对我们是重要的,常见的热门商品固然重要,但是相对冷门长尾商品同样重要,后者决定来商品库长尾的多样性。如果删掉某个商品,检索库可能就没有这个商品了,这是十分糟糕的。

因此我们在做数据淘汰的时候,需要考虑对有价值的长尾商品做保留。 图17展示了我们数据淘汰的方式,通过这种方式,我们窗口期内的数据质量将变得越来越高,全量数据的增长也相对可控。

以上我们大致介绍了“扫一扫识物”的离线系统中的所涉及的一些关键点,部分模块仍在持续优化中。未来扫一扫识物将引入更多场景的识别,拓展更多维度的物品,追求“万物皆可扫”的目标。

更多干货尽在腾讯技术,官方QQ交流群已建立,交流讨论可加:957411539。

前几日我还在逛街购物的情况下,遇到有些人在摆地摊,说成“扫一扫二维码微信公众号,就能领到精美礼品”。

本认为也是微信公众号线下推广的老套,但我扫二维码后发觉——竟然是“微信安全管理中心”的官方网账户。

难道说微信官网也是有增粉的KPI?

另一方跟我一通表述,我这才搞清楚,原来是叫我帮助给封号的微信号码辅助解封。并且另一方还再三向我保证,全部实际操作全是在微信系统里实际操作的,不容易有一切风险性。

我尝试实际操作了下,见到也要出示身份证件、储蓄卡等私人信息,就沒有再次实际操作下来。但也随着造成了许多疑惑:

这辅助解封究竟是什么实际操作?

我辅助解封的全是些哪些账户?

我的私人信息是否会因而泄漏?

出自于好奇心,我尝试扒了扒注册微信,发觉身后竟然藏着一条深灰色全产业链!


01注册微信身后,隐藏年入干万的爆利灰色项目

实际上谈起微信被封号,经营同学们应当也不生疏。前不久微信封袋杀第三方专用工具WeTool,许多做私域流量的同学们就有没有中招了。

一切正常状况下,假如自身的微信号被封,要是并不是被永久封号,能够根据别的微信朋友来輔助实际操作,进行自助解封。

但也有一些封号的账户,并不可以自助式进行解除限制。例如一些岗位微商代理,手里有很多乃至十几个账户,不太可能全部账户都实名验证,一些乃至沒有真正的微信朋友。这类一旦封号,就只有寻找一些“非传统”的方法。

因此许多人就看到了在其中的“创业商机”,根据给这种账号解封,获得爆利介绍费。

有多爆利呢?依据知乎问答网民@城369的曝料:一些解除限制精英团队做生意好的情况下,一天乃至就就能赚到五万多。

照这一收益计算出来得话,一年出来便是上干万的爆利做生意!

为何注册微信能那么爆利?

缘故关键有两个。

  1. 1)注册微信的要求十分大。

大家做私域流量的经营同学们,实际上并并不是注册微信的较大的顾客群,这些技术专业的微商代理和号商才算是真实的大顾客。

一般技术专业的微公司会出现许多个微信号码。针对她们而言,发布广告霸屏、故意营销推广全是基本实际操作,被举报、封禁也是家常饭,常常必须来为自己的微信号码做解除限制。

此外也有一些微信号码商,会用群控软件大批量注册帐号,少则好几千更多就是过万。这类大批申请注册的账户非常容易被手机微信检测到,一旦封号,就只有去找解除限制的中介公司大批量进行解除限制。


2)注册微信的价钱十分高。

我还在臥底的全过程中发觉,假如真的找这种技术专业做解除限制的人来解除限制一个微信号码,大部分必须二百到四百块不一的价钱。

几百元的价钱不划算,但针对前边提及的微商代理和票贩子而言,并算不得什么。

这种微商代理的微信里至少有两三千的朋友,全是依靠这种顾客来挣钱。她们一旦被封禁,损害全是按来天测算的。针对她们而言,花多少钱解封微信都算不上贵。

而针对微信号码商,她们把手上大量的账号解封以后,再用这种账号去微信里做情色、西兰花、乃至网络诈骗等违纪行为,赚的大量。这一点解除限制费仅仅不大的成本费。

所以说这种做注册微信的人,即便把价钱设到几百元一单,仍然不愁顾客。

依照300元解除限制一单计算出来,10单就能有3000收益了。更不要说这些有机构的个人工作室、解除限制精英团队,一天几十几百单,赚个几万块彻底没有问题。

02分工明确的全产业链条

我臥底了好几个注册微信业务流程交流群,发觉实际上上边这种爆利的注册微信业务流程,非常大一部分是技术专业的个人工作室来做的。

并且身后也有一条分工明确的全产业链条,有些人承担引流方法开发客户,有些人专业承担派订单,也有人承担找辅助解封的账户。

1)花样引流方法招数

这种注册微信的中介公司全是怎样开发客户、做引流方法的呢?

我还在检索材料的情况下发觉,手机微信、淘宝网那样的网络平台对“违反规定輔助别人解除限制”会采用限定对策,例如屏蔽掉有关的关键词搜索。因此 这种做注册微信的中介公司,会根据各种各样骚操作去别的服务平台做引流方法。

最先,最普遍的便是在微博上放长线钓大鱼式地发布广告。

新浪微博的管控相对性过松,这种解除限制的中介公司,一般用到wx、薇?代指手机微信,把顾客正确引导到qq群和微信群聊买卖。

这类引流方式关键赚个时差。尽管新浪微博的管控沒有手机微信、淘宝网那麼严苛,但時间一长这种营销推广广告宣传还会被封禁或是屏蔽掉。

次之,许多中介公司还会继续在百度问答那样的问答社区做引流方法。

一般碰到封禁,大家会本能反应地想起去问答社区给予帮助,因而这儿的客户更为精确。解除限制中介公司会挑选一些有关的难题做回应,例如

盆友微信号被封,如何帮他解除限制?

我的号封号31天,如何解除限制?大伙儿教教我

我的微信号被封了,要怎么解除限制?

因为服务平台的管控,下边的回应看起来全是一切正常的,好像全是在热情地具体指导客户依照靠谱步骤解除限制。但打开下“逼问追答”,你能发觉私下里全是在往自身的qq做引流方法。

最终,除开上边的二种方式 ,许多大的个人工作室也会自身建立网站来做引流方法。

我还在网页搜索“注册微信”,百度搜索第一条是来源于微信官网的答疑解惑具体指导。但以后的几个百度搜索全是各种各样技术专业做注册微信的个人工作室。


我随意打开了一个网页页面,网址的作用十分齐备,资讯新闻、品牌文化、服务中心每个版块像模像样。每个角落里的宣传语都会特别强调自身是“技术专业”、“靠谱”的注册微信精英团队。

网址里会出现很多正确引导的內容,正确引导顾客去qq群里做买卖。

2)创建代理商管理体系,逐层发单

引流方法寻找客户仅仅第一步,解除限制中介公司取得了大把订单信息以后,是怎样进行繁杂的实际操作给客户解除限制的呢?

前边和解除限制中介公司沟通交流的全过程中,另一方跟我说,要是我出示给他账户的登陆密码和地域,三十分钟内就能解除限制。

能保证这般“高效率”,就迫不得已谈起注册微信制造行业巨大的代理商管理体系了。

最先,制造行业里有一些专业的精英团队或个人工作室承担接单子。像上边提及的新浪微博、问与答、网址上的引流方法信息内容,许多就全是她们公布的。

根据这类方法,解除限制个人工作室每日都能接到很多的解除限制订单信息。但事实上她们非常少自身去辅助解封账号,只是去代理商精英团队来解除限制。

随后,代理商精英团队想去和解除限制的个人工作室商讨好价钱,再拿着解除限制的订单逐层下派。

这种代理商一般处在管理体系的中上游,她们能够立即去找辅助解封的人来进行手里的订单信息,也会去发展趋势自身的下属做分销商,赚个价差。

最终,会由管理体系底层的“dnf搬砖代理商”,承担找寻辅助解封的账户。以便提升解除限制的高效率,她们会提早找善人,在手里囤充足总数的輔助账户。

搬砖代理商一旦从上级领导代理商收到订单,立刻去找提早联络好的解除限制账户,就能立刻进行辅助解封。

根据那样巨大的代理商管理体系,解除限制精英团队一层层发单,能够更高效率地寻找辅助解封的账户。尽管每单的盈利被刮分了,但量充足多,最终的盈利依然十分高。

3)坑骗新手辅助解封

注册微信的中介公司们能够根据代理商管理体系逐层发单,但最后是怎样寻找这些辅助解封账户的呢?

我还在搜集信息的情况下发觉,微信官网对辅助解封账号的规定十分严苛(并且仍在不断升级)。

辅助解封微信号注册务必大半年之上;

解除限制频次不超过:1次/月,两次/大半年,3次/年;

账号必须绑定手机、储蓄卡和身份证件;

一些解除限制实际操作乃至还对輔助账号的所属地区有规定。

所以说每一个辅助解封的微信帐号大部分全是“一次性”的,代理商们必须不断地收集新的輔助账户,才可以满足需求。

①掩藏兼职网赚

我还在臥底全过程中遇到最普遍的方法,便是喊着做兼职、网络赚钱的旗号,在每个微信群聊发布消息放长线钓大鱼。

代理商们会用“伸伸手指就能赚钱”,“十分钟就能进行”那样的话术,令人感觉很轻轻松松就能赚到零花钱。一些对这一不了解的学员、宝妈妈,会非常容易就被这种销售话术吸引住。

除此之外,文章开头提到的地推也是很常见的手段。代理们会以赠送口罩、咖啡、气球、水杯等小礼品的方式,邀请路人来辅助解封。更有胆大的人,打着微信官方的名义做地推。

“微信安全中心”就曾报道过,有不少“地推扫码团队”声称自己是“微信团队”在举办安全推广活动,在路边摆摊宣传,以免费送小礼品的方式利诱普通用户参与扫码,辅助他们进行微信解封。



图片来源:微信安全中心

一些对微信不了解的小白看到都是在微信官方页面里操作,就放下了戒备。

但其实对于辅助解封的人来说风险很大。微信官方在《微信个人帐号使用规范》中明确规定:

对违规辅助他人解封的帐号限制使用微信全部或部分功能,并进行短期或长期封号处理。

也就是说,给陌生的违规账号辅助解封,很可能自己也会被封号。如果因为一点免费礼品或者几十块钱,导致自己的微信号被封了,实在得不偿失。

看到这里,相信大家已经知道微信解封这个行业水有多深了。

首先,微信解封的中介团队会在各个渠道发布信息,拿到解封的单子;

然后,中介会组建代理体系层层派单,快速地把订单派给可以解封的人;

最后,最底层的搬砖代理们会通过各种手段忽悠路人,来辅助完成解封订单。

但其实,通过这些解封团队来给自己的微信解封,风险很大。在我卧底交流群的这段日子里,大家也是相互骗钱,拿钱不办事的事情每天都在发生。



而且即使对方能给你解封,之后一旦被微信官方检测到是通过“非常规”手段解封,甚至会受到更严厉的处罚。原本只是封号 7 天,最后很可能成了“永久封号”。



所以说与其找这些不靠谱的中介解封,还不如自己提前做好准备措施。比如:

平时给微信绑定好银行卡、手机号,并且完成实名认证,提高微信号的权重;

避免同一个账号短时间内添加过多的好友,灵活使用活码工具;

提前添加一些好友和同事的账号,如果被封号了,也能找到好友辅助解封。

个人号能在遵守游戏规则的前提下,时刻保持满血状态,才是合格的运营。

在前面的章节中有提到开通微信商家收款码,对于打造微信支付交易流水,养出微粒贷额度有很大的帮助。

不仅如此,一旦开通商家收款码还有非常多的好处,比如通过微信商家收款码收款,可以累计商家积分,积分可用于兑换如:微信免费提现额度、腾讯视频VIP、各种微信支付收款设备以及生活用品等等。

所以开通微信商家收款码是非常必要的,不仅可以帮我们融资养出微粒贷额度,而且还可以帮我们省下不少钱。

那如何才能开通微信商家收款码呢?有两种方法:

一、没有营业执照的开通方法

如果你现在有正在经营的小店,但还没有申请营业执照,你可以先尝试申请收款码,具体步骤如下:

1、打开微信扫一扫,选择“收付款”

微信商家收款码

2、进入收付款之后,选择“二维码收款”

微信商家收款码

3、然后选择收款小账本

微信商家收款码

4、进入收款小账本之后,选择“收款码”

微信商家收款码

5、进入收款码页面之后,任意选择一个收款码版式,在这里以立牌版为例:

6、填写商家名称以及收货地址,然后支付相应费用,等待收款码到货

微信商家收款码

当收到收款码物料之后,我们需要对收款码进行激活,如何激活呢?

很简单,你只需要打开微信扫一扫物料中的二维码,然后会进入激活的界面,点击确认开启就可以激活收款码了,激活之后就可以通过此二维码进行收款了。

只要我们多用收款码收款,收的多了,就自然可以证明自己的商家身份了。

二、有营业执照的申请方法

如果你现在既有店面,又有营业执照,那就更简单了,直接进入收款小账本界面,选择补充经营信息,开启商家服务,具体步骤如下:

1、上传营业执照

微信商家收款码

2、完善商家经营资料

微信商家收款码

上传店铺头像、门店及摊位照片,填写店铺名称、经营范围、店铺地址以及联系电话之后,点击“认证为商家”,然后等待系统审核通过即可开通商家服务。

然后给大家看一下,开通商家服务跟没有开通商家服务所享受的功能服务前后对比照片:

微信商家收款码

可以看到,开通商家服务之后,顾客可以对商家进行留言、赞赏,开通会员功能,还有就是可以享受收款有礼,以后收款可以累积商家积分,用于兑换各种礼品:

微信商家收款码

总结:要想开通商家收款码享受各种商家服务,就必须证明你的商家身份,而要证明商家身份,要么就是通过门店、营业执照来证明,要么就是通过多收款来证明,二选一即可。

知乎客户端扫一扫功能在哪里呢?怎么找到呢?

1、知乎客户端扫一扫功能在哪里呢?根据以往其他软件经验,点击首页【+】按钮,如下图所示:

2、点开,却发现没有扫一扫功能,如下图所示:

3、终于找到了,原来在【我的】页面左上角,完美解决,如下图所示:

PS:文章截图为当前时间知乎最新版本

其他版本可能略有不同

如果有帮助到您,那是我的荣幸,撒花,啦啦啦!

“您好大爷,请扫一扫,出示健康码”

“什么康码?健什么码?健康什么?”

……

全国共有2.54亿老年人,其中仅有6000余万人是网民。

有将近3/4的老年人是不能熟练使用智能手机上网,甚至没有智能手机。

老年人不会弄健康码怎么办?

这样办!

我们和全国各地城市一起,陆续推出了健康码适老化方案。


刷身份证核验健康码 广州

广州市已率先启用了刷身份证核验健康码的“健康防疫核验系统”。

是的,只需要像乘坐高铁一样,将身份证放在识别设备上2秒,电脑屏幕就可以出现“粤康码”的相关信息。







(春运首日的广东省汽车客运总站,支持身份证查验健康码)


打印健康码核验 四川

“四川天府健康通”在发布之时就提供了“离线码”的功能。

老人、儿童可以下载打印“离线码”,在7天有效期内便可以随身携带使用。

小纸一带,没有智能手机健康码也在。



(“四川天府健康通”微信小程序的离线码功能上线两周便累积访问次数超250万,并且有近200万的老人、儿童使用。)


输入身份证核验健康码 北京、深圳

老年人和小孩,没有智能手机、不会用智能手机、没带身份证,都没关系。

只要记得身份证号码,就可以让助查人员帮忙查询健康状态。

父母和子女也可以帮爸妈和小孩查询。



“北京健康宝”近期发布上线了“老幼健康码助查询”功能。

深圳“深i您”,也在首页植入了“老幼健康码查询”的功能。

在征得被查询人同意的前提下,输入被查询人的身份证号,就可以获取相应的健康码状态。

健康码显示的时间只有10秒,杜绝了他人盗用、滥用健康码的情况。

子女帮爸妈查询健康码 全国


民众还可以登录国家政务服务平台小程序,进入“防疫健康信息码”服务。

领取成功后在亮码页点击“老幼健康码助查询”,即可进入实名身份验证页面。

数据显示,健康码适老化相关功能已覆盖全国至少3000万老年群体。

接下来我们将继续为老年人出行提供更便捷的服务、减缓公共场所疫情防控的压力,助力全国疫情防控工作。

经常有朋友问老Y有没有某能扫描王,虽然老Y也推荐过一些特殊版本,但经常性的用一段时间就不好用了。说实话那个扫描王确实也挺好用的,除了需要氪金~

今天老Y给大家推荐一款完全免费而且无广告的安卓app,而且功能绝对不输那个扫描王,一起来看看吧。


软件名:图片扫一扫

虽然软件的名字有点直白,但很符合老Y的胃口,打开后就能看到软件的主页。

由首页可以看出,功能主要分为五大部分:


01、扫描文件。如合同文档、票据、白板等。软件能够自动识别文档位置,自动矫正,多种格式一键分享!


02、扫描证件。很方便的扫描营业执照、身份证、驾照等,扫描正反面后可以一键生成复印件。


03、拍摄证件照。可以按照证件尺寸(小一寸、一寸……)以及证件照分类(各类证件、各类签证)进行拍照,而且可以快速更换背景,简直是制作证件照的神器!


04、扫码。这个功能就很好理解,有点像草料二维码,不仅可以扫码还可以自行制作如文字、网址、名片等二维码,很是方便。


05、图片。这个功能是针对图片的,包含了许多不错的功能,比如手持弹幕、多图转gif、图片去水印……老Y很喜欢这个功能。


软件主要的功能就是以上五个,最后还是要强调一下,这个软件是免费无广告的,好用良心到令人发指,强烈推荐!

最后下载地址如下:ilaoygzs.lanzous.com/iA

平台注册入口