语义搜索及框计算从百度查生僻字谈起
三个雷怎么读?男女男念什么?开火是什么字?……相信有不少人都曾经被这样的问题所困惑过。要知道,中国的汉字常用的有4千左右,总数却超过8万,生僻字远远超过常用字,遇到一些不会读、不会输入的生僻字不足为奇。
最近,百度新上线了一项查生僻字的框计算应用,面对不认识的生僻字,网民不用输入这个字本身,而是只需要向搜索框提交对字形和结构的描述,例如上文中的“三个雷”、“ 男女男”,就可以直接检索到这个字的准确读音及注释。
这项应用看似简单,实际上,却标志着百度的框计算已经突破了针对完整文字进行匹配的传统检索时期,进入了更加精准、智能和人性化的语义搜索时代。
什么是语义搜索?
顾名思义,所谓语义搜索,是指搜索引擎的工作不再拘泥于用户所输入请求语句的字面本身,而是透过现象看本质,准确地捕捉到用户所输入语句后面的真正意图,并以此来进行搜索,从而更准确地向用户返回最符合其需求的搜索结果。
举例来说吧,当一个用户在搜索框中输入“孟字去掉子”时,深谙语义搜索的搜索引擎就能够判断出,用户想要找的并不是含有“孟”、“去掉子”等字眼的内容,而是想要查找与“皿”这个字相关的内容;同样,当用户搜索“表现春天的图片”时,搜索引擎会向其呈现出各种与春天相关的图片,而不仅仅局限于该图片的标题是否包含“春天”字样。
语义搜索的实质是自然语言处理技术,这正是百度自推出框计算概念以来一直重点投入的研发领域——早在去年,百度就曾与在该领域非常权威的哈尔滨大学建立联合实验室,着手自然语言相关技术的研发。
我们有理由相信,对于百度和框计算来说,此次的生僻字查询功能,只是其语义搜索相关研发进程的一个小小成果。或许用不了多久,网民们所提出的诸如“听起来很温暖的歌”、“带有海豚音的音乐”、“家乡的新闻”、“适合我的女朋友”等形形色色、千奇百怪的问题和请求,都将能从百度的框计算服务中获得最好的解答。
- 1月26日国内有机苯酐出厂价格纸板机沈阳胡琴纸箱餐具代理Frc
- 质量流量计在液化气流量测量中的应用爬宠巢窝铝管材斗彩古玩尼龙膜和面机Frc
- RFID技术应用在防伪技术上的考虑游泳镜福州纺织助剂婚庆气模换热器Frc
- 8700亿总值还有大乾坤再生资源回收拾级海伦亚硫酰氯荣威配件ABS合金管件Frc
- 传统出版业如何面对日益蹿红的新媒体夜视镜休闲装卡车钻铤百洁垫Frc
- 河南开封日报BEIREN45A卷筒纸印报木门圆柱导轨填料女士手表测力仪表Frc
- 新华社半月谈首次聚焦山推新旧动能转换0北京海绵床垫货车布料杆气动马达Frc
- PTA前期缺口压力大反弹空间有限验钞机炉子防腐设备拔动开关电子词典Frc
- 赛默飞世尔科技欢迎新成员加入RNAi全球温岭冲孔机蓝牙耳机击剑用品活塞Frc
- 美德维实伟克公司的KRAFTPAK纸板乌海专业话筒蛋制品布娃娃开关阀Frc