对于这个话题我有话说。
我觉得确实最好是给每篇文章加上结构化的 tag,非常方便检索和整理。我举一个我经常上的论坛为例,里面很多文的开头都会贴上固定的模板,就像下面这张截图这样:
可以看到,这样的 metadata 对于读者还是比较有帮助的。
不过,最理想的形式,就是标题依然只是标题,正文依然只是正文,结构化的数据就不要混进文本中,而是单独以其它格式呈现。
其中最理想的方案,就是修改发帖的界面,在发帖的流程中直接让发布者选择一些分类,例如[原创/转载]、[连载中/完结/
已弃坑]、[玄幻/现实/…],再加上一些 pre-defined 的内容相关的 tag 可供作者选择(可以根据正文出现的关键字自动推荐 tag),当然,也允许作者自由输入其它的 tag。在发布之后,也允许社区的其它用户修改文章的 metadata(当然会有一定限制)。搜索功能当然也就可以充分整合利用这些 metadata,高效很多。
实际上在镜像里实现这样的功能,工作量并不大(可能也就是几百行、不超过一千行代码,一个周末足够了),我一度差点都打算实现出来了。但问题是大量的存量文章还是毫无 metadata 没法一时补上,而新的文章也不可能完全依赖作者,需要有人持续地确保 metadata 的正确性,而我一个人没可能有时间和精力一直 commit 到这事情上,我也不觉得目前这论坛里有那么多靠谱的热心人愿意做这件事。
你说一个破论坛总不可能招一个全职的 catalog librarian 来负责对吧。