写给MongoDB开发者的50条建议Tip7
本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。
首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。
Tip#7.Pre-populate anything you can
预先填充你能填充的
如果你知道,在将来,你的文档中肯定会需要一些字段,在你插入文档的时候就填充它们,而不是在需要它们的时候在创建,会更高效。例如,你正在创建一个站点分析的应用,可以查看一天中有每一页都有多少用户访问。你会有一个pages collection,每个document记录在过去的6个小时中,每分钟和每小时的访问量。
- {
- "_id":pageId,
- "start":time,
- "visits":{
- "minutes":[
- [num0,num1,...,num59],
- [num0,num1,...,num59],
- [num0,num1,...,num59],
- [num0,num1,...,num59],
- [num0,num1,...,num59],
- [num0,num1,...,num59]
- ],
- "hours":[num0,num1,...,num5]
- }
- }
这么做有一个优势,就是我们知道从现在到某一个时间点文档会是什么样子。是一个从现在开始,在接下来的6个小时,每分钟和每小时的访问量。后面的6个小时又会是一个新的文档。
因此,我们需要一个批量处理的任务,在空闲的时候,或者是在一天的固定时间,插入这些模板文档。插入的模板应该是下面的样子。
- {
- "_id":pageId,
- "start":someTime,
- "visits":{
- "minutes":[
- [0,0,...,0],
- [0,0,...,0],
- [0,0,...,0],
- [0,0,...,0],
- [0,0,...,0],
- [0,0,...,0]
- ],
- "hours":[0,0,0,0,0]
- }
- }
现在,当你增加这些计数器的时候,mongodb不需要为他们现去分配空间。只是更新已经插入的文档的值,这么做速度会更快。
例如,在刚开始的一个小时,你只需要这么做。
- db.page.update({"_id":pageId,"start":thisHour},{"$inc":{"visits.0.0":3}})
这种做法也可以扩展到集合和数据库的其他类型数据,如果你每天需要一个新的集合,最好预先创建他们。