gridfs 用于存储和恢复那些超过16m(bson文件限制)的文件(如:图片、音频、视频等)。
gridfs 也是文件存储的一种方式,但是它是存储在monodb的集合中。
gridfs 可以更好的存储大于16m的文件。
gridfs 会将大文件对象分割成多个小的chunk(文件片段),一般为256k/个,每个chunk将作为mongodb的一个文档(document)被存储在chunks集合中。
gridfs 用两个集合来存储一个文件:fs.files与fs.chunks。
每个文件的实际内容被存在chunks(二进制数据)中,和文件有关的meta数据(filename,content_type,还有用户自定义的属性)将会被存在files集合中。
以下是简单的 fs.files 集合文档:
{
"filename": "test.txt",
"chunksize": numberint(261120),
"uploaddate": isodate("2014-04-13t11:32:33.557z"),
"md5": "7b762939321e146569b07f72c62cca4f",
"length": numberint(646)
}
以下是简单的 fs.chunks 集合文档:
{
"files_id": objectid("534a75d19f54bfec8a2fe44b"),
"n": numberint(0),
"data": "mongo binary data"
}
现在我们使用 gridfs 的 put 命令来存储 mp3 文件。 调用 mongodb 安装目录下bin的 mongofiles.exe工具。
打开命令提示符,进入到mongodb的安装目录的bin目录中,找到mongofiles.exe,并输入下面的代码:
>mongofiles.exe -d gridfs put song.mp3
gridfs 是存储文件的数据名称。如果不存在该数据库,mongodb会自动创建。song.mp3 是音频文件名。
使用以下命令来查看数据库中文件的文档:
>db.fs.files.find()
以上命令执行后返回以下文档数据:
{
_id: objectid('534a811bf8b4aa4d33fdf94d'),
filename: "song.mp3",
chunksize: 261120,
uploaddate: new date(1397391643474), md5: "e4f53379c909f7bed2e9d631e15c1c41",
length: 10401959
}
我们可以看到 fs.chunks 集合中所有的区块,以下我们得到了文件的 _id 值,我们可以根据这个 _id 获取区块(chunk)的数据:
>db.fs.chunks.find({files_id:objectid('534a811bf8b4aa4d33fdf94d')})
以上实例中,查询返回了 40 个文档的数据,意味着mp3文件被存储在40个区块中。