千家信息网

写给MongoDB开发者的50条建议Tip7

发表于:2024-09-25 作者:千家信息网编辑
千家信息网最后更新 2024年09月25日,本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己
千家信息网最后更新 2024年09月25日写给MongoDB开发者的50条建议Tip7

本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。

首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。

Tip#7.Pre-populate anything you can

预先填充你能填充的

如果你知道,在将来,你的文档中肯定会需要一些字段,在你插入文档的时候就填充它们,而不是在需要它们的时候在创建,会更高效。例如,你正在创建一个站点分析的应用,可以查看一天中有每一页都有多少用户访问。你会有一个pages collection,每个document记录在过去的6个小时中,每分钟和每小时的访问量。

  1. {
  2. "_id":pageId,
  3. "start":time,
  4. "visits":{
  5. "minutes":[
  6. [num0,num1,...,num59],
  7. [num0,num1,...,num59],
  8. [num0,num1,...,num59],
  9. [num0,num1,...,num59],
  10. [num0,num1,...,num59],
  11. [num0,num1,...,num59]
  12. ],
  13. "hours":[num0,num1,...,num5]
  14. }
  15. }

这么做有一个优势,就是我们知道从现在到某一个时间点文档会是什么样子。是一个从现在开始,在接下来的6个小时,每分钟和每小时的访问量。后面的6个小时又会是一个新的文档。

因此,我们需要一个批量处理的任务,在空闲的时候,或者是在一天的固定时间,插入这些模板文档。插入的模板应该是下面的样子。

  1. {
  2. "_id":pageId,
  3. "start":someTime,
  4. "visits":{
  5. "minutes":[
  6. [0,0,...,0],
  7. [0,0,...,0],
  8. [0,0,...,0],
  9. [0,0,...,0],
  10. [0,0,...,0],
  11. [0,0,...,0]
  12. ],
  13. "hours":[0,0,0,0,0]
  14. }
  15. }

现在,当你增加这些计数器的时候,mongodb不需要为他们现去分配空间。只是更新已经插入的文档的值,这么做速度会更快。

例如,在刚开始的一个小时,你只需要这么做。

  1. db.page.update({"_id":pageId,"start":thisHour},{"$inc":{"visits.0.0":3}})

这种做法也可以扩展到集合和数据库的其他类型数据,如果你每天需要一个新的集合,最好预先创建他们。

0