每日一句: Build your own dreams, or someone else will hire you to build theirs. 打造自己的梦想,否则你就会被雇用去打造别人的梦想。 跟读

汉语站

2017年9月23日 星期六

丁酉(鸡)年八月初四

(图)暗网暗网

暗网是指互联网上的内容,不属于网络的表面,这是搜索引擎索引。据估计,暗网是大于几个数量级表面网站。

暗网 - 介绍 [回目录]

早在2003年就有美国人C·谢尔曼写成了一本学术专著专门讨论这一问题,只不过通常把它翻译成“看不见”的网站,这本著作已经被译成中文——《“看不见”的网站:Internet专业信息检索指南》,成为信息检索专业的必读书目。

2008年12月18日百度宣布其在上海成立的研发中心正式揭牌,百度董事长兼CEO李彦宏以及CTO李一男出席现场。百度还宣布了“阿拉丁平台”计划,该计划为解决现有搜索无法抓取和检索互联网上存在的大量Hidden Web(暗网)问题。据悉,百度已经投入超过1千人研发该平台。

暗网 - 相关新闻 [回目录]

“‘阿拉丁’所解决的问题,是一个互联网长期存在的问题。”在百度上海研发中心挂牌仪式上,李彦宏表达了他对“阿拉丁平台”寄予的厚望。

众所周知,互联网是一片信息的海洋,但困扰无数技术巨头的正是:如何让用户轻易地在信息海洋中找到所需?

据了解,在现有技术水平下,解决这个问题十分勉强。

记者了解到,在没有边际的信息宇宙中,很多人类信息并没有被Web化,而且即使是一些Web化的信息,也没有全部纳入到搜索引擎的检索体系。目前能够被搜索引擎检索到的信息只占人类信息中非常小的一部分,更多的信息都存在于“暗网”(Hidden Web)之中。而科学家们一般认为:如果现在搜索引擎能够检索到的网页数是百亿量级的话,那么“暗网”的信息量应该是万亿量级的。据百度方面透露,百度此次建立“阿拉丁平台”,就是要对包括“暗网”在内的所有信息进行更为深入的分析、融合、处理,使这些Web化的信息能最富有效率地被用户通过搜索引擎进行检索。在“阿拉丁计划”的支持下,搜索引擎技术可以超越现有Web内容的限制,为用户提供零成本、无障碍、无时差的精准搜索结果。

事实上,将会于明年初面世的“阿拉丁平台”是百度对现有搜索引擎体系的一个补充和延伸。早在百度两三年前推出贴吧、知道、国学等搜索产品时,这一平台就已经开始系统化、有步骤的建立。虽然目前该平台尚未推出,但已有业内人士认为,百度“阿拉丁平台”的搭建和完善,将有望彻底解决互联网及搜索引擎“内容不足、不够精准”等“暗网”问题,从而实现“一个搜索框解决所有信息需求”这一“天方夜谭”。

暗网 - 百度“阿拉丁” [回目录]

百度"雪藏"多年之久的"阿拉丁计划"终于浮出水面。2008年12月18日,在百度上海研发中心的揭牌仪式上,百度CEO李彦宏携刚刚履新的百度CTO李一男一同出席,并向外界首次透露了正在推进的"阿拉丁计划"。"百度有2000名核心工程师,现在有超过1000名的技术力量投入了"阿拉丁平台"的研发。"李一男表示,"上海研发中心成立后,还会有更多的工程师加入到这一搜索"暗网"的团队中。"阿拉丁平台是在百度宣布推出"有啊"、进军C2C电子商务业务之后,又一次引发业内大震动的举措。业内人士评论说,百度"阿拉丁平台计划"实际上是搜索引擎行业的一次前瞻性研究和探索,将对未来搜索引擎和互联网的格局产生重要影响和变革。

"阿拉丁":"暗网"世界的探照灯

记者在上海研发中心挂牌的发布会上了解到,互联网上有着大量的HiddenWeb,也就是"暗网"的存在。目前能被搜索引擎检索到的信息只占人类所有信息中很小的一部分,大量的信息仍然处在"未知世界"当中。有数据显示,"已知"在"未知"中的比例大约为千分之二。"这一方面是因为目前很多人类信息并没有实现Web化,另外一方面,即使是一些已经Web化的信息,也因为没有纳入到搜索引擎的检索体系而无法被人们便捷的获取。"艾瑞咨询总裁杨伟庆告诉记者。

百度阿拉丁平台的推出,正是为解决现有搜索引擎无法抓取和检索"暗网"信息而来。"如果我们把百度搜索引擎比做一个探照灯,在无边无际的信息宇宙中扫射并且记录下来,那么,那些探照灯从来扫射不到的区域,都是"暗网"。如何将这些已知和未知信息分门别类地融合,有序地纳入到我们的知识范畴,并且能够为广大互联网用户提供零成本、无障碍、无时差的精准送达,是有史来我们在技术上面临的最大挑战。"李一男对阿拉丁计划的艰巨性直言不讳。

在李一男看来,对HiddenWeb的抓取仅仅是"阿拉丁计划"的"试水",更高层次的搜索还在于,它将对HiddenKnowledge,也即对人类"未知的知识"进行挖掘和整理。一位搜索引擎专家说:"搜索引擎需要做的,就是如何将信息从人类的大脑以及其他地方挖掘出来。"今年汶川特大地震发生后的紧急救援中,就是百度贴吧的一位网友发帖、并经诸多网友的努力传播,救援部队才找到了合适的降落地点,顺利完成了空降任务。"可以这么说,阿拉丁是一个开放的搜索引擎平台,它是百度的,更是面向所有人的。我们希望未来的搜索引擎,能像阿拉丁神灯那样,在瞬间满足用户所有的搜索需求。"李一男这样描绘着百度心目中搜索引擎的未来。中国互联网协会副理事长高卢麟也表示:"这不仅对中国,对于整个人类的信息和知识交流而言,都有着非常重要的意义。"

李一男加盟百度的"处子秀"

这次百度上海研发中心的揭牌仪式也成为李一男加盟百度的"处子秀"。作为百度的首席技术官,李一男在公众场合首度亮相。这位被业界公认为技术天才,他接受李彦宏的邀请执掌百度技术的方向,人们一直充满着期待。

中国是世界上仅有的四个拥有独立搜索引擎技术的国家之一。作为互联网上游最尖端的技术,搜索引擎在很多国家都被列入重点攻关项目,比如日本的"信息大航海计划"、欧盟正在推进的"轰鸣计划",都在大力支持本国搜索引擎的自主研发。业内分析认为,李一男在技术前沿领域的领悟力及创新力,不仅将带领百度在技术上实现新的突破,而且势必将为搜索引擎带来产业标准上的革新。一位受邀参加揭牌仪式的互联网技术专家表示,随着百度业务的不断扩大,也给技术的研发及技术研发人员管理提出了新的课题,李一男在百度作用也将愈加明显。

百度虽然在10月推出了网上交易平台--有啊,正式进军电子商务领域,但是以"搜索"为核心的战略一直没有变。有人问及阿拉丁平台的推出,是否意味着百度在开发"下一代搜索引擎",李一男表示,"百度自问世以来,简约的网页虽然一直沿用至今,但是搜索技术的内核已经发生了翻天覆地的变化。百度一直在进步,一直在为用户提供一个更加便捷可依赖的搜索引擎而努力。"阿拉丁平台"是百度发展的一个必然阶段,我们会在搜索上做的更好。"

百度:立足上海,剑指日本

随着美国金融危机全球经济的影响,很多公司都开始裁员、裁减新项目,以削减支出度过经济"寒冬"。一些跨国互联网巨头就纷纷推迟了建立数据中心的计划,并大规模削减运营开支。而百度却"逆势而动"。联系今年年初百度进军日本搜索引擎市场,分析认为百度意在加快全球化布局的战略步伐。

统计部门数据显示,现在中国互联网产业在GDP中的比重只有7%,但是在上海这样的经济发达地区,信息产业已经实现了从新兴工业到"第一支柱产业"的跨越,成为一个涵盖二、三产业的综合产业门类。同时,上海作为华中地区的枢纽,在此地建立研发中心,不仅增加了对华东以及海外英才的吸引力,而且在地域上更加接近日本市场,为日本市场进一步的开发和拓展奠定了基础。

日本是百度进军海外的第一个跳板。在日本市场上与Google雅虎等跨国搜索巨头展开"短兵相接",并且成功晋升为日本市场上第四大搜索引擎,这对于百度而言是个质的飞跃。"以前大家将百度在中国市场上的成功更多的归结为"更懂中文",现在我们用自己的搜索技术证明,百度的成功源于"更懂搜索",百度可以在中文之外的搜索市场有所作为。"

李一男在接受专访时告诉记者,作为深化搜索技术、取得世界级领先优势的"阿拉丁平台"计划,需要更加积极的推进,"百度要打造最好的搜索引擎,百度会在今后一如既往的加大对研发上的投入。"


参考链接:http://www.itbear.com.cn/ZiXun/2008-12/14663.html

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。

标签: 暗网

同义词: 暂无同义词

词条统计

浏览次数 : 7407 次

编辑次数 : 1 次 历史版本

更新时间 : 2009-08-09

双语连环画