本文最后更新于:2024年8月19日 下午

MongoDB 是 Nosql 数据库的典型代表,python 可以很方便地链接操作。

前置配置

MongoDB

Python

  • 安装 pymongo
1
pip install pymongo

基础操作

链接数据库

1
2
3
4
5
6
from pymongo import MongoClient
# 建立MongoDB数据库连接
# 以下命令都可以连接数据库
conn = MongoClient('127.0.0.1',27017)
conn = MongoClient(host='127.0.0.1',port=27017)
conn = MongoClient('mongodb://127.0.0.1:27017/')

如果需要用户名密码也可以在其中加入参数,同样可以使用以上三种方式

1
2
3
4
5
6
7
conn = MongoClient('127.0.0.1',27017)
db=conn.test_db
db.authenticate('root','123456')
# 上述方法仅适用于 pymongo 4.0 (不包含) 之前的版本

conn = MongoClient(host='127.0.0.1', port=27017, username='root', password='123456',authSource='test_db')
conn = MongoClient('mongodb://root:123456@127.0.0.1:27017/?authSource=test_db')

认证方式更新

查询数据库列表

  • 查看数据库列表
1
2
conn.list_database_names()
['admin', 'config', 'local', 'waline']

选择数据库

  • 在链接中选择数据库
1
mydb = conn.admin

创建集合

  • 在数据库中创建集合
1
comment = mydb["Comment"]

注意: 在 MongoDB 中,集合只有在内容插入后才会创建! 就是说,创建集合(数据表)后要再插入一个文档(记录),集合才会真正创建。

查看集合列表

  • 数据库中查看集合
1
2
mydb.list_collection_names()
['system.users', 'system.version', 'Users', 'Comment']

选择集合

  • 数据库中选择集合
1
collenction = mydb['Comment']

添加数据

插入单个文档

  • 集合中插入单个文档使用 insert_one() 方法,该方法的第一参数是字典 name => value 对。
1
2
mydict = { "name": "RUNOOB", "alexa": "10000", "url": "https://www.runoob.com" }
x = collection.insert_one(mydict)
  • insert_one() 方法返回 InsertOneResult 对象,该对象包含 inserted_id 属性,它是插入文档的 id 值。

插入多个文档

  • 集合中插入多个文档使用 insert_many() 方法,该方法的第一参数是字典列表。
1
2
3
4
5
6
7
8
9
10

mylist = [
{ "name": "Taobao", "alexa": "100", "url": "https://www.taobao.com" },
{ "name": "QQ", "alexa": "101", "url": "https://www.qq.com" },
{ "name": "Facebook", "alexa": "10", "url": "https://www.facebook.com" },
{ "name": "知乎", "alexa": "103", "url": "https://www.zhihu.com" },
{ "name": "Github", "alexa": "109", "url": "https://www.github.com" }
]

x = collection.insert_many(mylist)

无论使用何种方式插入数据时,如果没有 _id 字段系统会自动创建,也可以手动指定插入

查询数据

查询单个文档

  • 我们可以使用 find_one() 方法来查询集合中的一条数据。
1
2
mycol = mydb["sites"]
x = mycol.find_one()

查询集合中所有数据

  • find() 方法可以查询集合中的所有数据,类似 SQL 中的 SELECT * 操作。
1
2
3
4
mycol = mydb["sites"]

for x in mycol.find():
print(x)

查询指定字段的数据

  • 可以使用 find() 方法来查询指定字段的数据,将要返回的字段对应值设置为 1。
1
2
3
4
mycol = mydb["sites"]

for x in mycol.find({},{ "_id": 0, "name": 1, "alexa": 1 }):
print(x)
  • 返回 name, alexa 字段
1
2
3
4
{'name': 'RUNOOB', 'alexa': '10000'}
{'name': 'Google', 'alexa': '1'}
{'name': 'Taobao', 'alexa': '100'}
{'name': 'QQ', 'alexa': '101'}

根据指定条件查询

  • 可以在 find() 中设置参数来过滤数据。
1
2
3
4
5
6
mycol = mydb["sites"]
myquery = { "name": "RUNOOB" }
mydoc = mycol.find(myquery)

for x in mydoc:
print(x)
  • 输出结果为:
1
{'_id': ObjectId('5b23696ac315325f269f28d1'), 'name': 'RUNOOB', 'alexa': '10000', 'url': 'https://www.runoob.com'}

计数

  • 集合.count_documents(query) 可以统计集合中符合条件的查询数量
1
2
3
4
5
collection = mydb['Comment']

query = {'url': '/notes/hexo/theme/next/6-add-valine-comments/add-valine-comments/'}
res = collection.count_documents(query)
print(res)

高级查询

  • 查询的条件语句中,我们还可以使用修饰符。

  • 以下实例用于读取 name 字段中第一个字母 ASCII 值大于 “H” 的数据,大于的修饰符条件为 {“$gt”: “H”} :

1
2
3
mycol = mydb["sites"]
myquery = { "name": { "$gt": "H" }
mydoc = mycol.find(myquery)

使用正则表达式查询

  • 还可以使用正则表达式作为修饰符。

  • 正则表达式修饰符只用于搜索字符串的字段。

  • 以下实例用于读取 name 字段中第一个字母为 “R” 的数据,正则表达式修饰符条件为 {“$regex”: “^R”} :

1
2
3
mycol = mydb["sites"]
myquery = { "name": { "$regex": "^R" } }
mydoc = mycol.find(myquery)

返回指定条数记录

  • 如果我们要对查询结果设置指定条数的记录可以使用 limit() 方法,该方法只接受一个数字参数。
1
2
mycol = mydb["sites"]
myresult = mycol.find().limit(3)

获取子数据

拿到数据后,需要调用 get 方法获取字典中的数据:

1
print(mydoc[0].get('_id'))

修改数据

修改单条文档

  • 使用 update_one() 方法修改文档中的记录。该方法第一个参数为查询的条件,第二个参数为要修改的字段。如果查找到的匹配数据多于一条,则只会修改第一条。
1
2
3
4
5
6
mycol = mydb["sites"]

myquery = { "alexa": "10000" }
newvalues = { "$set": { "alexa": "12345" } }

mycol.update_one(myquery, newvalues)

修改多条文档

  • update_one() 方法只能修匹配到的第一条记录,如果要修改所有匹配到的记录,可以使用 update_many()

  • 以下实例将查找所有以 F 开头的 name 字段,并将匹配到所有记录的 alexa 字段修改为 123

1
2
3
4
5
6
mycol = mydb["sites"]

myquery = { "name": { "$regex": "^F" } }
newvalues = { "$set": { "alexa": "123" } }

x = mycol.update_many(myquery, newvalues)

删除数据

删除单个文档

  • 使用 delete_one() 方法来删除一个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
1
2
3
mycol = mydb["sites"]
myquery = { "name": "Taobao" }
mycol.delete_one(myquery)

删除多个文档

  • 使用 delete_many() 方法来删除多个文档,该方法第一个参数为查询对象,指定要删除哪些数据。
  • 删除所有 name 字段中以 F 开头的文档:
1
2
3
mycol = mydb["sites"]
myquery = { "name": {"$regex": "^F"} }
x = mycol.delete_many(myquery)

删除集合中的所有文档

  • delete_many() 方法如果传入的是一个空的查询对象,则会删除集合中的所有文档:
1
2
mycol = mydb["sites"]
x = mycol.delete_many({})

删除集合

  • 使用 drop() 方法来删除一个集合。
1
2
mycol = mydb["sites"]
mycol.drop()
  • 删除成功 drop() 返回 true,如果删除失败(集合不存在)则返回 false。

数据排序

  • sort() 方法可以指定升序或降序排序。
  • sort() 方法第一个参数为要排序的字段,第二个字段指定排序规则,1 为升序,-1 为降序,默认为升序。
1
2
3
mycol = mydb["sites"]
mydoc = mycol.find().sort("alexa")
# mydoc = mycol.find().sort("alexa", -1) # 降序排序

参考资料



文章链接:
https://www.zywvvd.com/notes/coding/python/python-mongodb/python-mongodb/


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

Python 链接/操作 MongoDB 数据库
https://www.zywvvd.com/notes/coding/python/python-mongodb/python-mongodb/
作者
Yiwei Zhang
发布于
2022年9月1日
许可协议