收藏文章 楼主
西祠创始人重入互联网 正式推出爬狗网
网友【老编】 2006-12-05 07:20:20 分享在【时代发展的印记】版块    1    1
顾建兵

上海报道

蛰伏了近5年之后,陈辉民,这位西祠胡同的创始人再次踏入了互联网。

陈现在的职务是南京爬狗信息技术有限公司CEO,11月20日,经过两个月的测试后,他花费3年时间打造的爬狗网正式推出。

“跟Google等搜索引擎不同,我们的搜索信息是表格化的。”11月30日,陈辉民对记者表示,爬狗网是专门用来搜索分类信息的垂直搜索引擎,希望能结合全球最大的搜索引擎Google和全球最大分类广告网站Craigslist两者的优势。

然而,这个市场正在迅速升温,爬狗网刚一诞生就面对着无比强大的对手。Google和Microsoft陆续宣布进入网络分类广告搜索市场。

11月16日,Google推出了酝酿已久的Google Base,用户可以在站点上提交各种在线或离线分类广告信息及图片,每一条信息获得唯一的标签,以便和他人共享各种分类信息。目前Google Base还在测试阶段,中文信息还不是很多。

Microsoft也正在开发网络分类广告市场,并计划在接下来的几周内正式推出 “Fremont”服务,用户在上面可以卖、买或交换物品,并展示相关的信息,运营开支由搜索结果旁边的广告支持。

此外,美国一家本地分类广告搜索创业公司Oodle已经可以搜索到400万个分类广告。

垂直搜索机会

“垂直搜索引擎会是趋势。”陈辉民对记者说,Google、Yahoo!已经占领了通用型搜索引擎市场,这时候能够做的就是垂直的搜索引擎。在美国,博客搜索引擎Technorati目前已能搜索到2060万个博客;购物搜索引擎Shopzilla能够搜索到来自6万多个商家的近3000万件商品;而Yahoo!旗下的HotJobs则是专业化的求职搜索引擎。

陈辉民坦言,他之所以选择分类广告搜索,是因为看到了Craigslist在美国的惊人火爆。相关调查显示,在美国的很多大中城市,分类广告都是报纸第一大财源,而Craigslist使旧金山湾区的报纸每年损失近6500万美元的招聘和求职广告收入,以及数百万美元的商品和房地产广告收入。而在中国的北京、上海等大中城市,分类广告收入也占据着都市类报纸收入的很大份额。

2005年,eBay投资的分类广告网站客集齐在国内推出,在此前后国内涌现出唯客网、分类哥哥等数十家分类广告网站。“分类广告会逐步从报纸向网络转移。”激动集团股份有限公司副总裁胡志东告诉记者,胡目前负责管理激动集团投资的唯客网。

“爬狗要做的就是让用户轻松的搜索到这些网络分类广告信息。”陈辉民认为,就像当初美国西部的淘金热,“去分类广告业淘金的人太多了,我要做的就像是给淘金的人卖水。”

“我是有互联网情结的。”陈辉民说,1998年,22岁的陈同刘琥等三位伙伴在南京创办了后来人气颇旺的BBS社区——西祠胡同。

虽然西祠胡同当时相当火爆,但是并没有能够带来什么收入,这段时间,陈辉民等人只好依靠销售网吧计费软件来补贴网站,“当时比较迷茫,看不到前途”,陈回忆说。

1999年,陈辉民决定离开西祠胡同转而投向实业界,“我得去学会做‘真正’的生意”。一年多以后,西祠胡同以100万元现金加100万元股票的价格被E龙收购。同年,他把自己炒股赚来的60万元全部投入了一家珠宝公司,此后,在滚动发展中又介入了房地产和化学纤维领域。

2002年,陈辉民找了五六个技术高手开始了搜索引擎的研发,“当时感觉到国内的所谓门户,如新浪、Sohu.com只是大的ICP,他们将所有的用户指向自己的内容,而搜索引擎才是整个互联网的门户”,他认为未来搜索引擎必将取代门户的地位。

凭着多年的炒股经验,陈辉民感觉,互联网在经历了第一轮泡沫破裂之后,必然还会有一波复兴的行情,这时进入互联网业界并不算晚。靠着在传统产业的赢利,他在此后不断加大搜索引擎研究的投入,“大概投了300多万进去”。

但是在当时,陈辉民自己也并不知道要研发的搜索引擎最终到底会是什么样子,“只是探索性质的研究”。

现在,爬狗网的研发人员已经扩充到了40多个,“明年研发队伍要扩大一倍。”陈辉民说。

格式化表现

“爬狗的信息都是表格化输出的。”陈辉民对记者说,这是爬狗跟Google最大的不同之处。

第一代的搜索引擎,如早期的Yahoo!,所使用的搜寻方法是:网页建构人将自己的网站加入搜索引擎的资料库中,自行命名网站,并用几行文字描述该网站;在使用者键入搜索关键词后,搜索引擎会找出和搜索条件一样或相近的网站名字或描述。不过,第一代的搜索引擎最大的缺点就是无法针对网页内容进行搜索。

以Google为代表的第二代搜索引擎就不需要输入任何资料,而是由搜索引擎使用一个“Googlebot”的Spider(蜘蛛)程序,也就是俗称的“爬虫”,让这个“爬虫”在网络上自动抓取资料,并自动将取得的结果存入资料库中。

不过另外一个困惑也随之产生,Google的搜索引擎为网页搜索引擎,也就是说,使用者输入想要的关键词,Google会输出一堆网站链接,使用者再去链接到这些相关网站进一步寻找信息,这种方式一直延续到现在,这种搜索方式的麻烦之处在于搜索出的结果实在太多,查找起来很麻烦。

“我们的爬虫程序可以读完网页的全文,将使用者所需要的信息点从目标网站中提炼出来。”陈辉民告诉记者,爬狗由于应用了自有知识产权的格式化搜索技术,能把有用的信息直接从多个目标网站中提取出来,用表格化的形式提供给用户,用户在爬狗上输入想要的关键字,爬狗会输出一个链接,同时会输出一个表格,包含了用户想要的信息的各个方面。

实际上,由于爬狗已经帮助用户搜集整理了寻找到的信息列表,用户就不需要花费大量时间和精力在多个网站上去寻找,只要看表格的内容就可以知道是不是自己所需要的信息。

比如用户想要找一套房子,通常情况需要通过搜索引擎搜索到多个房产类网站,然后到每一个网站上去寻找合适的房子。而爬狗具有搜索比较功能,能够按照房型、面积、楼层、区位、价格等要素把符合要求的房子全部列举出来,方便了用户从中选择最合适的房子。
meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

1   2006-12-05 07:20:20  回复

回复/评论:西祠创始人重入互联网 正式推出爬狗网

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 中美AI竞争的新格局已定?
  2. 英伟达H200芯片的对华销售仍然在受美国的两重限制
  3. 人类史上“最贵CEO”诞生!马斯克的“万亿薪酬”背后
  4. 在海外漂泊12年后的真实感受
  5. 感恩节餐桌的费用回落,零售商推出了低价套餐!
  6. 美国移民局(ICE)新提案打算限制福利使用,有记录者可能影响绿卡申请!
  7. 川普政府终于听说了日本新首相【高市早苗】因为台海表态引发外交危机的事儿了?
  8. 川普政府再次出奇招!拒绝所有胖子的移民申请?
  9. ICE启动了在社交媒体的全天候监控项目
  10. 美国青少年“67”流行语的现象引关注
  11. 美国在AI竞争中失利了?阿里千问模型在全球领先
  12. 五角大楼的机密报告:中国导弹可以击沉美军航母
  13. 学习英语12年后,终于实现了“美国梦”!
  14. 黄仁勋警示川普政府,再不开放“对华AI芯片出口”就来不及啦!
  15. 全球高等教育的新趋势:留学生求学地“多元化”
  16. 多名移民法官在同时期被解雇,引发司法危机
  17. MIT稳居了CS榜首!美国大学的最新排名出炉
  18. 美国“H-1B”签证新规:在境内的申请人,免缴10万美元费用!
  19. SpaceX在加速IPO计划,目标估值1.5万亿美元!
  20. 美国仍然依赖纸质信件的真相剖析
  21. 外国人的入境中国手续简化,可以提前在网上填报入境卡了!
  22. 恢复或加入?重获中国国籍的路径比较
  23. 在特朗普访华之前,白宫向中国“递三份礼物”
  24. 美宝家庭关切:双国籍审查和户口注销真相
  25. 中美高层通话后… 川普总统计划明年访华,芯片管制也松口了!
  26. 中美经贸磋商“展现战略对称”新态势
  27. 一美分硬币“Penny”铸造历史正式终结
  28. 2026年版的“公共负担”新规复活,华人家庭遭遇精准打击!
  29. 强制注销户口?传闻中国在加强双重国籍监管
  30. 美国政府批准了对台3.3亿美元的军售
  31. 中美两国元首在釜山会晤:就关税、大豆和稀土已经达成共识
  32. 川普总统正式签属涉台法案,解放军示警!
  33. 联邦政府启动“红色日落行动” 审查比特币矿机的供应链
  34. 中美稀土博弈,美国政策在急转直下!
  35. 45岁后“人生黄金期”是认知和创造力的新高峰
  36. 中国已经全额缴纳了联合国会费,联合国的财政危机缓解!
头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(1) 分享
分享
取消