深圳SEO_深圳网站优化_网络推广公司-深圳百姓云霸屏

网站优化外包:根据“闪送”的方法(百度搜索众测平台)

未知

【摘要】: 图片搜索由于在搜索目标上的特殊性,往往依赖于图片所在网页的文本来判断图片的内容(我们成为图片周边文本)。而周边文本往往不能很好的表达图片的内容,并且一张图片往往在多个网页中被引用,图片周边文本也不太一致,甚至于很多图片并没有周边文本,因此给图片搜索算法提出了更高挑战。 通过“众包”的方式(百度众测平台)为图片进行信息标注,从而提高搜索引擎的准确性和召回率往往是一个比较有效的方法,并且标注的数据可以作为

  【引言】:

  图片搜索因为在检索总体目标上的独特性,通常取决于照片所属网页页面的文原本分辨照片的內容(人们变成照片附近文字)。而附近文字通常不可以非常好的表述照片的內容,而且一张图片通常在好几个网页页面中被引入,照片附近文字都不太一致,甚至是许多 照片并沒有附近文字,因而给照片优化算法明确提出了高些挑戰。

  根据“闪送”的方法(百度搜索众测平台)为照片开展信息内容标明,进而提升百度搜索引擎的精确性和召回率通常是一个较为合理的方式,而且标明的数据信息能够做为照片深度学习的样版数据信息,针对提升照片深度学习的成功率也是挺大的实际效果;可是在图片标注的全过程中也有很多难题必须处理,比如:

  (1)客户舞弊难题:在“闪送”服务平台中,有由于个人爱好参加标明的,也是由于服务平台激励制度而参加标明的,因而会存有一部分客户以便获得奖赏而开展舞弊的个人行为,这种舞弊个人行为会给标注数据的成功率产生挺大的危害;

  (2)怎样对客户的标明开展正确引导,促使标明的信息内容更加精确,让客户的标明成本费更低,标明全过程更加有挑战性,进而提升标明的高效率;

  文中所提及的就是说一种含有防舞弊作用的,可以对客户的标明信息内容开展细分化正确引导,进而促使标注数据愈来愈精准的图片标注方式。

  在文中所叙述的图片标注游戏里面,客户被区别为二种种类:

  (1)叙述者:系统对呈现的一张图片用一段文字或是两组关键词开展叙述,表述出照片的內容和特性;

  (2)判断者:系统软件向其呈现多个照片(一般状况下以4张)及其一段叙述文本,这一段叙述文本所相匹配的照片也包括在所呈现的照片之中,判断者依据“叙述文本”筛出相匹配的照片;

  客户能够随时随地在“叙述者”和“判断者”中间转换真实身份,可是不容易出現客户自身分辨自身所叙述的照片的状况。系统软件将“叙述者”叙述的照片分派给“判断者”的情况下有一套优化算法保证不容易分派给“原叙述者”,而且也不会分派给间距“叙述者”较近或是将会了解的“判断者”。我们在文章内容后边会叙述这一分派优化算法。

  一、“叙述者”叙述照片的全过程

  图1:图片标注系统软件

  如图所示1,当客户点一下“图片标注系统软件”的“叙述照片”按键以后,系统软件会从照片uci数据集(照片TRL结合)中任意筛出一百个照片TRL,随后逐一给客户展现照片(如图2和3)。

  图2:叙述照片(甲壳虫昆虫)

  图3:叙述照片(甲壳虫汽车)

  图4:叙述照片(甲壳虫乐队)

  二、“判断者”分辨照片的全过程

  图5:分辨照片

  当客户挑选“分辨照片”的情况下,系统软件也会挑选任意挑选一百个早已有标明(就是说有客户叙述)的照片,每一次展现一段标明文本及其相对的4张图片(能够是大量张,系统软件能够配备)。如图所示5,最上边深蓝色框里边是现有客户标明“甲壳虫汽车”,正中间是系统软件选择出去的4张图片,选择的优化算法后边会有详解。选择的照片之中包括客户标明相匹配的照片,比如图5中就是说相匹配正中间的鲜红色甲壳虫汽车。

  当客户分辨出照片以后,要是用鼠标单击相对的照片马上会在照片附近有鲜红色的框架将照片圈起,客户点一下再次分辨就可以递交分辨結果并进到到下一个标明文本的分辨。

  三、“判断者”的选择方式

  以便避免舞弊,系统软件有一套“判断者”选择方式,关键防止以下的舞弊个人行为:

  (1)“叙述者”分辨自身所标明的照片;

  (2)“叙述者”和“判断者”中间协作舞弊;

  系统软件的解决方式以下:

  (1)“叙述者”在标明照片的情况下,系统软件会纪录叙述者的账户和网络ip;

  (2)系统软件在选择“判断者”的情况下会挑选不一样的账户,而且对网络ip开展部位变换,挑选一个间距“叙述者”很远的“判断者”;

  (3)系统软件会纪录“标明文本”的分派历史纪录,不容易将同一个“标明文本”反复分派给同一个“判断者”,“叙述者”和“判断者”中间的不断舞弊成本费很高;