从“网络数据可管理”走到“网络数据已被管理”,是网络架构形式到网络内容管理的全新转变。在大型企业网内部,特别是那些网络信息更新较快、信息化程度较高的企业,选择一个行之有效的解决方案,将企业内部资源整合、细分、归类,乃至动态分析,已经成为提高工作效能、降低运维和沟通成本的最大诉求。
  网络信息的膨胀,使得数据管理问题日渐严峻。尽管互联网数据仍然无序,但是大型企业网数据,已经能够走向有序性。企业搜索引擎,这一类正在崛起的方案和市场,使得企业网数据有序化的转型得以实现。
  遗憾的是,基于传统网络结构的搜索引擎和搜索工具,并不能解决企业客户在应对内部信息寻找和整合时的需求。为了让企业用户更多地了解企业搜索技术,了解企业搜索引擎带来的价值,同时,也让产品设计商和开发商能够更接近用户的需求,从而更快推动企业搜索市场的发展,《计算机世界》举办“2006年企业搜索市场热点研讨会”,专业企业搜索提供商、资深分析师、行业典型用户,第三方专家,话题直指企业搜索市场应用及趋势。
大部分企业的内部网数据,正在以每年200%的速度增长,其中,有80%的数据,以各种文档文件、邮件和图片等非结构化形式,散落于企业内计算机系统中的各个角落,而这些数据总量远远超过了互联网上信息的总量。
  《计算机世界》报副总编辑 林润华:首先,很高兴能够邀请到各位专家参与到这次关于“企业搜索”的讨论中来。一段时间以来,我们在密切关注企业内部搜索的相关技术、市场、需求,以及产品,或者说,我们在关注“知识化搜索引擎”的问题。
  对于企业而言,数据管理的难度,不是随着数据增加量成倍数增加,而是呈指数增加。根据我们的观察,互联网搜索技术对于企业内部数据而言,局限性大,有时甚至不能起到作用。我们考虑,通过对“企业搜索工具及价值”的关注和讨论,让更多的人,特别是企业用户,更了解企业搜索的特性,特别是和传统互联网搜索观念不一样的地方。
  我们也在想,如果在一个企业或者很多企业当中,或者在政府部门当中,采用企业或者智能化的搜索技术,会不会给企业内部办公效率的提高带来直接明显的变化?建立一个知识化的内部网络,以及其上的知识化企业,能够给企业发展和竞争力带来多大的好处?
需求足够强烈
  与此同时,已经有调查数据显示,企业发布到互联网上的数据,只占企业有效信息总量的1%~2%。有超过98%的数据存储在企业内部。面对如此不成比例的数据量,专业企业搜索市场的未来预期相当庞大,然而,企业对内部数据的认识,大多仍然停留在“很重要,但是不知道如何让重要变得必要”的阶段。现阶段企业用户对企业搜索技术的了解究竟有多少?企业搜索的解决方案提供商,是否真的时时刻刻在考虑更加贴近用户的需求?
  首都之窗运行管理中心技术总监 王喆:从外在看,首都之窗是政府的门户网站,主要的任务是传达政府的相关信息。从内部看,首都之窗是一个围绕政府信息的大数据库。我们也一直在考虑搜索的问题。2003年我们跟百度谈了一个项目,百度想卖一个搜索引擎给首都之窗,但是我觉得搜索引擎对首都之窗而言意义不大。后来的项目中,我们要求百度做了ASP服务,但到目前效果都不是太好,这也可能也跟百度本身侧重点有关系。
  政府网站的应用本身跟其他网站的搜索引擎有一些不同。政府网站有一个“群”的概念,有点像大的总公司和一大群小分公司的感觉,政府门户有的时候更像垂直门户,网民到我这儿搜的不是娱乐性的东西,可能更关注于某一方面的、集中度更高的信息。
  对于企业搜索引擎的需求,首都之窗是很明显的。例如首都之窗的“北京市投诉热线”,作为北京市所有市民都可以使用的网上投诉平台,这个系统是向公众开放的。由于这个机制很方便,各种投诉量相当高,系统本身效果不错,但首都之窗希望能有一个产品,从大量的信件里面收集和整理出来一些辅助领导决策的信息来。比如最近一段时间,老百姓对什么样的东西最热衷,或者什么样的东西影响将来市领导的决策等,领导做决策的依据越多,所做出决策速度和准确度就越高。
  政府里面的资源真是多得不得了,我去政府各个部门调研,看到各类信息资源白白的闲置着觉得特别可惜,但是确实是出于安全问题,不能随意访问。这就需要人工整理分类,然而政府部门公务员是有限的。必须有一个手段,高效又安全的共享一些有用的信息。其实从我们角度上来讲,关键的并不是能不能实现一个网群搜索,而是能不能把我们资源整合起来提供出去。
北京交通大学网络信息中心主任 贾卓生:企业搜索的需求是明显存在的,这种需求不仅是政府比较多,高等学府更是突出。以学校为例,互联网上搜索引擎搜索出来的东西,很多是对教授和学生没有太大帮助的。我们学校每年都要花二三百万购买几十个数据库资料,信息量非常大,但是到目前却没有一个有效的搜索系统,这样老师要花很长的时间查找资料。而且各学校、各部门的系统中的都有很多的教学资料、课件、教案、书籍等资源,没有方便地统计和归类系统,这些信息也就混乱无序,学生没有办法把这些资料搜集出来。企业搜索工具和它们提供的方案,可能能够解决这个问题。
  但是我要强调的是,教育界更加需要企业级搜索的可能是中小学。我参加过北京市中小学专家整体方案的监督工作,各种方案的验收我都参加了,有一些中小学重复建设太多。现在大学都联网了,可以互相访问,而中小学还是比较分散的,又没有互联,学科重复建设比较多,如果能在各中小学中使用企业搜索,使得资源能够共享,那就太好了。
产品不能孤立
  应对用户需求,以及或隐或现的庞大市场,企业搜索方案提供商们一方面期待良多,一方面也不无思虑。如何能为企业客户创造出真正的价值,而不是仅仅画饼充饥?如何为企业搜索提供全面的解决之道,而不是仅仅提供一个搜索工具?更进一步,如何企业搜索和最终的企业效能提速有机整合起来,而不仅仅是作为一个遥远的方向?不同产品提供商,有各自的不同考虑和观点。
  北京拓尔思(TRS)信息技术有限公司市场部经理何东炯:这需要对照国内外的情况来看,TRS是国内做企业搜索引擎最早的公司,也是在这个领域专注的公司,我们已经发现了一些问题。例如在国外,和企业内网数据相关的设计,往往由咨询顾问公司完成,有专门的数据设计和管理架构队伍来做应用;但是在国内,我们甚至找不到合适的顾问和实施队伍。这样带来的第一个问题就是,概念普及上要缓慢得多。如果一个工作,做的人那么少,那么能够得到推广的机会就会少很多。很多情况下,不是企业不重视网内数据,而是它们还不知道内网数据的管理可以做到系统化、知识化。
  搜索产品市场的现状,和数据库市场不一样,后者已经经过长时间普及教育,企业已经普遍认识到其重要性,而且围绕数据库软件设计开发有大量的从业人员,而搜索产品市场目前仍然还处于推广期,这个期间有多长,并不仅仅取决于我们厂商多努力,而取决于整个产业环境,从政府到媒体、从参与者的数量到企业内网的成熟度等。
  对于企业搜索这种专业细分的行业市场,缺乏咨询人才是当前的一个重要问题,产业链上没有单独的咨询顾问环节,往往厂商既做咨询又做实施,国外厂商不是这样“玩”的,这样做的效果也很难最优化。
  北京赛金传媒科技有限公司首席运营官陈一宏:TRS的考虑是正确的,其实这也是我们的重点关注问题。我想要补充的一点是,软件方案,应当尽量实现联动,这样才能使价值得到提升,企业搜索引擎也一样。一定要能够和现有网络的内部系统结合起来。这方面可以看一看IBM,它们的思路之一,就是将软件和企业内网的其他各种应用相结合,例如将呼叫系统和调度系统结合起来,和数据库结合起来,这些才是它的关键竞争力。IBM的用武之地,不是单独的软件开发,而是软件的相互嵌入和整合。
要考虑“汉语特征”
  针对企业搜索引擎应用的思路,可以充满公立的关怀特征,甚至不带任何企业的标签。但是在产品形态和功能实现上,不同的企业必然有自身的特征和定位,而客户又将如何选择? 
  TRS公司产品经理贺兆辉:或许我更适合谈一谈这方面的情况。其实产品的本质就是为了解决问题,这方面我确实也有些感想。
  在最近我接触的客户中,已经有一些认识到企业搜索引擎中蕴藏巨大能量了,例如海尔、索尼,它们都是从业务角度出发去考虑问题,考虑得很详细、很深刻。还有,无论是企业间的知识共享,还是商业数据库的相互合作,在国内的需求和趋势都是明显的。企业搜索工具,不仅要能够实现互联网信息的优化搜索,还应当能够真正地搞清楚企业内部数据的整合工作如何进行,并加以实现。
  也有一些厂商提到,它们可以做这个、可以做那个,但是最终的结果呢,还 是互联网的那一套,其实这不是很好,会给这个新兴行业的发展造成不利影响。在研讨会上谈企业自己的产品,可能不太合适,我想强调的一点是,现在进入国内的国外企业搜索产品,都有一个根本性的问题,就是中文处理瓶颈。对中文的识别和处理,可以说是国内企业网内数据管理的根本性特征之一,针对这种特征,用国外产品加入汉化,或者使用汉化插件,并不能解决根本性问题。企业搜索不单单是产品的问题,本身还是个综合解决方案,是一个整体性方案的全面整合。我可以举一个最简单的例子,“乒乓球拍卖”这个词的检索和理解上,就可以看出TRS和国外产品之间的不同,在中文处理方面的大量积累,是TRS的优势,而这点国外厂商显然还不能适应。
  何东炯:企业搜索的数据量与互联网不一样,用户对企业搜索的要求更高,这就要求信息检索要更精确、更全面。信息异构性的整合和信息安全管理也是我们一直思考的问题。在TRS产品的构建过程中,企业原来管理系统、业务系统包括内部组织结构的规划,以及多级安全的措施,都必须给予充分的考虑。
  还有一个更重要的问题是,很多人认为企业搜索就是购买产品、集成到现有系统中就完了,但这不是正确的思路。虽然TRS是一个企业搜索方案提供商,按照商业合同部署产品并且保证上线就可以了,但是我们还是一直在呼吁客户要重视,企业搜索不是终点,不是将所有信息汇集起来就行了,一定要深挖其价值,这才是搜索的目标所在。企业搜索出来的信息,可以提供给领导作为决策辅助,或者提供给市场人员做营销分析,甚至可以提供给企业战略发展作为金融情报和战略指导,企业应当分析自身的搜索信息目的,以便于寻求适合的企业搜索厂商,通过企业搜索把信息整合起来,挖掘信息的价值。
  陈一宏:经常有一个误导,把搜索和知识管理混为一谈。由于概念的误导,使用户对企业产品要求过高,那带来的结果是什么?就是失望。使用不可能实现过高的期望的产品,用户就会发现这儿也不好用,那儿也不好用,其结果只能是失望。
  我研究过国外一些案例,国外企业在使用企业搜索软件时,往往通过几个步骤去完成。第一,把各类信息统一搜索上来;第二,找到内容与内容的关联;第三,用自动化的技术解决标语、分类和热点查询和分析的问题。也就是说,国外企业在做企业搜索时,也没有做到特别大。企业要先搞清企业级搜索是什么,要实现什么,不要将企业搜索的需求定的过高、过虚。企业搜索不仅要有大规模的采集技术,更要有精妙的算法,如果在一个企业内部,信息系统并没有互联,企业级搜索也就无法实现。
期待仍有很多
  计算机世界传媒集团信息中心主任 周群:我想对于企业而言,在选择产品和解决方案过程中,还是要先确定自己想要获得什么样的“企业搜索”。是企业内部一些信息的搜索还是外部一些信息的搜索?如何在搜索的同时,继续保存企业内部信息“权限”的分配?无论是大学还是企业,大家希望的是有工具实现信息的条理化、更高效的共享和查询,但绝不是实现所有信息的共开。
  除了权限以外,虽然“企业搜索”相比互联网搜索是小量的,但如何把企业外的信息整合起来,也是希望企业搜索工具提供商关注的问题。现阶段“企业搜索”的方法是,由服务器进行信息检索,然后再整合起来。而内外部如何进行整合是一个问题。有人做互联网搜索、也有人做桌面搜索,但桌面搜索是否起到连接的作用,这是个问题。
  计世在线经理饶渐平:“企业搜索”是比较重要,一方面是因为购买者是企业,应用的成功和失败,带来的反应都比较大。
  我个人理解,“企业搜索”本身就不是宽泛定义。我们通常说搜索,其实指的是广义搜索,就是在互联网大海里面去“捞”,希望的是“多”、“全”;而企业搜索则是力求“精”、“准”。所以我觉得,随着技术增加,由于信息源搜索能力的增强,用户市场,包括商业目的市场也会变化,这可能会导致企业搜索市场在发展过程中出现一些转变,例如商业机密问题如何规避,企业内网整理所得的关键数据会不会因为泄露导致致命性威胁?
王喆:政府的数据这样的担忧就更多了,拿出来会遇到很严重的安全问题。这些数据不是一年、两年才形成的,已经积累了多少年了,互联网才有几年,那种海量程度,真的拿出来要比互联网现在的量高出不止一、两倍,权限判断几乎全得靠人工处理,因为电脑不可能自己知道什么重要什么不重要,因而这是个很难解决的问题。
  贾卓生:还有一个问题是当资料本身的划分就模糊时,该怎么办。就拿大学来说,高校网络中的资料专业性、综合性很强,有几十个专业的资料很难划分门类,而且各大学把BBS都限制在校内,跨学校之间资料的搜索就显得很困难,但很多学生还是希望能看到清华、北大的资料是什么样的,实际上各大名校的BBS已经有了很多讨论群,比如清华BBS对某个技术的讨论,谁都可以加入讨论,这已经形成了跨学校间的技术讨论群,上述资料与讨论群要整合起来,目前仍然有一定困难。

  企业要有革新意识

  对于网络信息更新较为迅速、信息化程度较高的企业来说,如何做才能很好地整合内部资源,提高工作效能,降低沟通成本?每个用户都有自己的应用特点,企业搜索将会如何发展呢?
  何东炯:从用户角度看,要一次性投入就达到所有数据百分之百的整理完毕,显然是期待过高了。如果将企业搜索引擎看作一个工具,或许更现实一些。企业除了在搜索的基础上要做应用,可能还要做很多工作,而这个工作是个性化的。原因在于,企业搜索市场仍在成长中,还没有形成同质化的产品,或者说同质化的完全成熟的产品。每个用户都有自己的应用特点,所以说选择软件提供商,只是第一步,是选择核心需求的满足,而在这之后,就要偏重测试应用,这对于用户而言,既能理解,也能接受。
  而关于保密性问题,完全可以进行内部整合,为不同权限的人,制定不同的搜索和范围,最终也能起到各级别的信息归类。比如公安部门的搜索引擎项目,第一步需要把公安部下面各地的一千多个网站上的所有案件信息、人口信息深度整合,但是在不同的级别,看到的信息量是不一样的,这样就能很好地解决问题。
  陈一宏:企业采用企业搜索是必然趋势,但是怎么上、多大规划,要看实际情况。对于现在的技术需求,要有一个和谐的匹配。一个“企业搜索”平台能否用的好,在于你的规划,使用上也需要企业有技巧和想法。在这个前提下,如果能够好好掌握,能够带来很大的好处。
  何东炯:是的,通过今天的讨论,无论是厂商还是用户,对需求和考虑的理解都多了一些,收获不少。尽管当前企业搜索市场还不是很成熟,用户需求变化幅度也比较大,整个市场模式也还需要探索。现在虽然我代表的是厂商、是TRS,但是原先我也做过用户、做过甲方,从用户角度一定要清楚自己的需求,厂商那边才好配合,如果厂商完全给你编需求,第一不适合你的情况,第二很难用好。另外,企业搜索也好,CRM也好,ERP也好,最好是一把手工程。部、局等部门用户的考虑终究会有不同,有的关心社区,有的关心文档库,有的关心保密,有分歧就很难有好的规划。
  最后,我还想提前宣传一下,我们TRS于8月16日在北京国际会议中心也会举办“TRS垂直搜索引擎应用研讨沙龙”,届时TRS将携搜索市场的专家与广大用户朋友们共同探讨新搜索引擎服务模式的应用,也希望感兴趣的朋友能够登录TRS网站进行参与。
  王喆:对于搜索之所以造成企业级搜索不好用的现状,主要原因并不在提供商,而是现在大多数企业的内网数据资源质量不高,或者就是各个部门搞了很多壁垒的前提下,想纯靠技术来实现信息整理的完整性,这其实不是很现实的一件事情。
  很多领导经常说,技术这个东西不是问题,我们从来不考虑技术,电子政务,七分是政务,三分是电子,只要我们能想到的,技术就能实现。但是我每次都跟领导说,其实要说技术能实现的话,我也赞成,但是一定有两个条件,第一无限金钱,第二无限时间。给我一千亿,再给我一千年,我什么都能做到,现在不是什么都能做到,要想配合企业搜索达到理想的目标。
我们最近也一直在讨论这个问题,厂商要不断的研发中文分词。中文有一个特点,如果分词分不好的话,或素材再好,做出来的效果也不好。这方面,国内公司的优势要比国外厂商好一些。建议国内厂商能通过比较规范的标准或者一系列的基础工作实施,能够使得基础数据或者信息资源能够做到更加规范,梳理所有企业信息、政务公开的项目,梳理所有公共服务的项目,慢慢把这些基础的东西都做好,都规范化一点,这样的给未来的企业搜索提供更好的基础环境,让企业搜索发挥比较好的效率。

责任编辑:admin