维基百科最高产量的作者,凭一己之力把小语种推上第二多条目-

维基百科最高产量的作者,凭一己之力把小语种推上第二多条目

阿里云服务器优惠

正如网路最常用的语言是英语,英语版维基百科同样也是全球 309 种语言中内容最丰富的。今年 1 月,英语版维基百科条目正式突破 600 万条。

奇妙的是,全球第二多条目的语言,并不是西班牙、法语等「大语种」维基,而是宿雾语(Cebuano)版维基,共有 538 万条目。

如果你没听过这种语言,也很正常。

宿雾语是菲律宾使用的小语种,懂得讲宿雾语的人合计不超过 2 千万。且宿雾语版维基虽然有 500 多万条,但管理员只有 6 人,活跃用户也只有 14 人;相比之下,英语版单管理员就有 1,143 人,活跃用户更超过 10 万人。

原来宿雾语版维基 500 多万个条目,99% 内容是名为「Lsjbot」的机器人完成的。同时它也是维基百科最高产的作者。

状态好,一天能创立 10 万个条目

Lsjbot 的「爸爸」Sverker Johansson 是瑞典物理学家,拥有语言学、经济学和土木工程学位。他的妻子是菲律宾人,通晓宿雾语,因此 Lsjbot 在瑞典语和宿雾语维基百科都有创作内容。

Johansson 表示,自己一直以来都对「一切事物的起源」充满兴趣,并认为维基百科未来应可「让所有人了解所有事」。于是,他花了几个月编写出 Lsjbot,想用更快捷的方式将维基百科推向「囊括一切」的美好愿景。

▲ Sverker Johansson。

Lsjbot 做的事情有点像「拓荒」,将 0 变成 0.5。

它不会撰写系统丰盈的条目,只会简单创立一个条目,放上最基本的资讯,这种条目称为「小条目」(stub),有待用户进一步补充和丰富内容。Lsjbot 专注的领域也比较窄,主要都是生物物种和地理相关内容。

▲ Lsjbot 一般生成的小条目。

Lsjbot 生成内容的过程也非常程式化。首先,Johansson 会先就特定领域编写模板,然后寻找可信、机器可读的资料库为资讯来源,再让 Lsjbot 根据模板「填空」,并完成后期发表工作。效率高时,Lsjbot 一天能完成 10 万条小条目。

听这个工作描述,大家也能感觉到,Lsjbot 虽冠名几百万条条目,但内容其实都只是乾巴巴的「骨头」,缺乏人类的创造力和思考,自然惹来部分活跃作者的不满。

整体来说,我反对机器人生成的小条目。(它们)只包含或多或少正确的分类资讯,但却缺乏动物外观等重要资讯。

41 岁的 Achim Raschka 说,他是德语版维基百科的积极贡献者,常常会花好几天完成一篇关于某种植物的深度条目。

Johansson 也承认,Lsjbot 创造的内容的确很无趣,但也坚持这些内容有自己的价值。在他看来,Lsjbot 的条目能补充一些维基社群缺乏的领域。

维基百科作者的多样性被诟病许久,有研究发现在维基百科撰写内容的人大部分都是住在北半球发达国家的男性白领,擅长科技产品。Johansson 指出,瑞典语版的维基百科,关于《魔戒》角色的条目就超过 150 条,但关于越南战争的内容却少于 10 条:

我对托尔金没意见,且相对(越战的)「春节攻势」,我也更熟悉(《魔戒》)索伦发起的战争,但这样真的是均衡的百科全书吗?

虽然 Lsjbot 的内容「乾巴巴」,但 Johansson 希望这些知识骨干能抛砖引玉,启发未来维基作者探讨原有社群「舒适圈」以外的内容。

这也是为什幺我认为 Lsjbot 这个「拓荒牛」只将 0 做成了 0.5,因为得有人类创造性参与,0.5 才能走向 1。

维基百科除 Lsjbot 外,还有大量不同功能的机器人,已成为社群不可或缺的成员。

维基百科的「机器人军团」

我们常开玩笑说,机器人得来一次大罢工,所有人才会懂得感恩它们对社群的奉献。

赞(0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  • potplayer
  • directx