- 冒号空间 - http://blog.zhenghui.org -

关于信息系统组织方式的一个提案

关于信息系统组织方式的一个提案

序言

昨日整理Gmail信箱之时,觉有不便之处,于是进入“Suggest a feature for Gmail”的页面,准备提些建议。不意一只灵感的小虫悄悄爬上脑梢,急欲捕之而后快。遂作“A Proposal on Organization of Information System”一文,以备Gmail参考之用。甘冒不谦之嫌,窃以为该提案是对包括文件系统、邮件系统等在内的信息系统的组织方式的一种创新。为让更多的国内同仁了解,现将此文译成中文。仓促成文,还望诸位方家不吝赐教。

郑晖于2008519

1. 引言

我们生活在一个信息 时代,但有时信息带来的负担甚至超过收益。从用户的角度看,大多数信息系统包括文件系统、邮件系统和各类基于菜单的系统本质上都是层级 (hierarchical)结构的。随着信息量的递增,系统的可用性却在递减。这种结构的主要缺陷是它仅提供了通往目标信息的单一通道。用户在任何一个转角处走错都可能导致最终迷路。如果一个信息系统能支持多路通道,情况就会得到改善。有鉴于此,本文借助Gmail系统的一些思想提出了一个切实可行的方案。

2.信息检索之困

信息是个好东西,可储存和重新获取却令人头痛。日复一日地,一个典型的计算机用户浏览并保存网页,收集心仪的书签和RSS,从BTemule上 下载文件,收发电子邮件,编写文档或程序。他愉悦地享受着这一切,直到有一天他发现自己逐渐为信息超载所困扰。一个明显的迹象是他时不时感到有点头晕—— 他的桌面凌乱不堪,各种图标如沙丁鱼般“济济一堂”;他的书签菜单展开来如巨毯般一直拖到地上;他的信箱塞满邮件,鼓鼓囊囊、几欲暴裂。他开始意识到如果 这种状况不改变,他的脑袋一定比硬盘或邮箱更早爆炸。此后,他养成了将文件、书签和邮件整理到层级文件夹中的习惯。情况果然大为改观。惜乎好景不长,文档 数量增长迅猛,文件夹越来越多、越来越深。将一个文档保存到合适的地方需要花费时间,而找回当初下载或创建的文档则更花时间。整日在树状结构中穿梭,他有 些倦恼和迷失了。他知道自己拥有一棵遮天蔽日的圣诞树,上面挂满了琳琅满目的礼物,可是没有多少是触手可及的。每每在掘地三尺仍一无所获之后,他不得不怀 疑自己的记忆,偶尔也忍不住怀疑机器的记忆。明知那些失踪之物从来不会自动跳出来,他还是情不自禁地冲着电脑歇斯底里:那些该死的文档到底躲到哪里去了? 时不时地,他又滑回老习惯:将所有最新的文件保存到桌面,不为别的,只是那里似乎更方便更令人放心。我们不禁要问:这种困境的根源是什么?

3. Gmail解决方案

问题出在传统的信息组织方式上,即树(或森林)型结构。这种层级结构应付大量信息尚胜任有余,但对于海量信息则有些不堪重负。随着信息量的膨胀,树型结构越来越力不从心。许多文件夹中的列表不可避免地变长,一些文件夹被深层嵌套。在文件系统中,通过在Windows中创建捷径或在Unix类的操作系统中创建符号链接(symbolic link)能一定程度上缓解一些症状,但显然不能根治。作为一种有趣的替代方案,GoogleGmail提供了他们称作“标签”(label) 的工具。一个标签是一种文字标记,它能与其他的标签同时应用到一条信息上。开始许多用户抱怨它,因为他们习惯了文件夹风格。但这种抱怨慢慢减少,用户发现 他们的信息不再是藏于密密丛林的游击队,而是一字排开等待检阅的正规军。所有最近的信息都在顶部,而这在精心组织的文件夹系统中是不可能的。用户不再为如 何分类信息而犯难,他们可以在每条信息上贴上任意多的标签。找一个特定的信息也很容易,既可用自定义标签来过滤,也可用系统标签如inbox, sent, star, chat, trash等来过滤。他们还能通过收信人、发信人、主题和信息内容来搜索。更好的是,用户可定义过滤器自动为来信贴标签。这种解决方案,今后我们称为标签结构,不必囿于邮件管理系统,它能有效地用于文件系统和其他诸如知识管理系统之类的信息系统。

4. 改进方案

标签结构并非尽善尽美。尽管与信息数量比,标签要少得多,但依然会泛滥。在Gmail的 标签结构中,所有用户定义的标签是独立而平等的,但事实上——不同的标签在重要性、紧急性和常用性上可能大相径庭;一些标签有着内在联系;同一信息上的不 同标签在相关度上也有所不同。比如,“工作”或“家庭”的标签更重要,“待做”或“考试”的标签更紧急,“体育”或“电影”的标签对一个体育迷或电影迷来 说更常用。当一个程序员将一些资料标记为“Java”或“C++”后,他很希望它们能自动加上“程序语言”和“OOP”的标签,以便今后它们能出现在一个列表中。最后,一些标签可能比另外的标签更能描述一条信息。综合以上考虑,我们提出如下可行方案。

5. 结论

要定位一项信息,用户在层级系统中需要点击文件夹在展开,在标签系统中需要点击标签来过滤。我们没有提及搜索是因为搜索较慢且有些信息不以文本形式存在。标签系统是更好的解决方案,但仍有不足之处。为了进一步方便信息检索,我们设计了含权有向图标签结构weighted digraph tag structure),这是一种结合树型结构的优点的标签结构。一个具此结构的信息系统应该更加平易近人且令人愉快,它的用户可以象悠闲的养鱼人,不管往池塘里投入多少条鱼,只要一声口哨,他想要的那条就会摇头摆尾地游过来。

Share