gridfs 用于存储和恢复那些超过16m(bson文件限制)的文件(如:图片、音频、视频等)。
gridfs 也是文件存储的一种方式,但是它是存储在monodb的集合中。
gridfs 可以更好的存储大于16m的文件。
gridfs 会将大文件对象分割成多个小的chunk(文件片段),一般为256k/个,每个chunk将作为mongodb的一个文档(document)被存储在chunks集合中。
gridfs 用两个集合来存储一个文件:fs.files与fs.chunks。
每个文件的实际内容被存在chunks(二进制数据)中,和文件有关的meta数据(filename,content_type,还有用户自定义的属性)将会被存在files集合中。
以下是简单的 fs.files 集合文档:
{ "filename": "test.txt", "chunksize": numberint(261120), "uploaddate": isodate("2014-04-13t11:32:33.557z"), "md5": "7b762939321e146569b07f72c62cca4f", "length": numberint(646) }
以下是简单的 fs.chunks 集合文档:
{ "files_id": objectid("534a75d19f54bfec8a2fe44b"), "n": numberint(0), "data": "mongo binary data" }
现在我们使用 gridfs 的 put 命令来存储 mp3 文件。 调用 mongodb 安装目录下bin的 mongofiles.exe工具。
打开命令提示符,进入到mongodb的安装目录的bin目录中,找到mongofiles.exe,并输入下面的代码:
>mongofiles.exe -d gridfs put song.mp3
gridfs 是存储文件的数据名称。如果不存在该数据库,mongodb会自动创建。song.mp3 是音频文件名。
使用以下命令来查看数据库中文件的文档:
>db.fs.files.find()
以上命令执行后返回以下文档数据:
{ _id: objectid('534a811bf8b4aa4d33fdf94d'), filename: "song.mp3", chunksize: 261120, uploaddate: new date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41", length: 10401959 }
我们可以看到 fs.chunks 集合中所有的区块,以下我们得到了文件的 _id 值,我们可以根据这个 _id 获取区块(chunk)的数据:
>db.fs.chunks.find({files_id:objectid('534a811bf8b4aa4d33fdf94d')})
以上实例中,查询返回了 40 个文档的数据,意味着mp3文件被存储在40个区块中。