data:image/s3,"s3://crabby-images/9ccb0/9ccb01c70a628bd9fa9f2570c307b2c26d46075e" alt="Python 3 爬虫、数据清洗与可视化实战(第2版)"
3.3 存储数据到MongoDB
MongoDB是一个基于分布式文件存储的数据库,由C++语言编写,旨在为Web应用提供可扩展的高性能数据存储解决方案。
MongoDB是一款介于关系数据库和非关系数据库之间的产品,它在非关系数据库中功能最丰富,最像关系数据库。
3.3.1 下载并安装MongoDB
1.下载MongoDB
到MongoDB的官网下载MongoDB即可。
2.配置本地MongoDB
MongoDB每次启动时都需要在CMD中进行配置,找到安装目录下的bin文件夹路径,如图3-11所示。
data:image/s3,"s3://crabby-images/a44c2/a44c2ac30f824375fd837c82495b875686ca79e3" alt="img"
图3-11
由CMD进入以下路径:
data:image/s3,"s3://crabby-images/09b83/09b834538ac4ac3c8d2f24bc1d5480a4f46a70d0" alt="img"
配置数据库路径,配置前要先在C盘中新建文件夹,代码如下。
data:image/s3,"s3://crabby-images/72ef8/72ef8682263059589e2e27a5ebcf87d00d2bfe82" alt="img"
代码运行结果如下所示。
data:image/s3,"s3://crabby-images/274fe/274fe73546cfc07cc794449a4ec90d8293b5a679" alt="img"
再打开一个CMD,进入MongoDB确认数据库已经启动,进入bin路径,如下所示。
data:image/s3,"s3://crabby-images/c3181/c31816445ee699e6ce3940c2f6241d1e35eee8a3" alt="img"
输入“mongo”连接数据库,显示“>”就代表MongoDB已经正常启动,如下所示。
data:image/s3,"s3://crabby-images/1b097/1b097f3aee5580ac9de7f2e1145b2f88a05b2fda" alt="img"
3.3.2 在PyCharm中安装Mongo Plugin
在PyCharm中,依次执行“File”g“Settings”g“Plugins”→“Browse Repositories”命令,输入“mongo”,然后选择“Mongo Plugin”,如图3-12和图3-13所示。
安装好后重新启动PyCharm,就可以在右侧看到Mongo Explorer。
如果没有这个窗口,则可以将鼠标光标停留在左下角的图标上,然后在自动弹出的菜单中选择“Mongo Explorer”命令,如图3-14所示。
data:image/s3,"s3://crabby-images/23875/238750057465c9f2efa8919f8eb2defec78ee82e" alt="img"
图3-12
data:image/s3,"s3://crabby-images/56b8d/56b8da72c0f68749730202b6ce01e9d8c0c5124f" alt="img"
图3-13
data:image/s3,"s3://crabby-images/aad13/aad131f99e61eae62a305031db6682c7b05c6f1d" alt="img"
图3-14
接下来在Mongo Explorer窗口中单击设置按钮,创建连接(通过PyCharm File菜单中的Settings也可以设置),如图3-15所示。
data:image/s3,"s3://crabby-images/ccecc/cceccbfb1bb1ecc1641da2de5328c3a39c088007" alt="img"
图3-15
在Mongo Servers设置窗口中单击左侧的加号按钮(addServer),如图3-16所示。
data:image/s3,"s3://crabby-images/d7fec/d7fec8825a86ca26e9824fee8719139fec5ec566" alt="img"
图3-16
输入连接名,单击“Test Connection”(测试连接)按钮,当提示信息为“Connection test successful”时表示连接正常,然后单击“OK”按钮保存设置即可,如图3-17所示。
data:image/s3,"s3://crabby-images/5923a/5923a436f1d737a052b06626e4409526128bf26e" alt="img"
图3-17
3.3.3 将数据存入MongoDB中
下面尝试将获取的数据存入MongoDB中,首先输入以下代码。
data:image/s3,"s3://crabby-images/6861b/6861b5f1091de030548f8232b4d6dbcccfeefabb" alt="img"
运行后双击连接,可以看到名为weather的数据库,如图3-18所示。
data:image/s3,"s3://crabby-images/e8c72/e8c72ccd59ca0b9b0f748ec35f2977dbf4b513b7" alt="img"
图3-18
展开weather数据库,双击sheet_weather_3这张表(见图3-19(b)),会弹出预览窗口(见图3-19(a)),可以从该窗口中观察获取到的天气预报数据,数据以JSON格式存储在数据库中。
data:image/s3,"s3://crabby-images/3ad2c/3ad2c4a6ac7c774387c724f1fe9545122224ce13" alt="img"
图3-19
可以直接在预览窗口中展开JSON的树形结构,如图3-20所示。
data:image/s3,"s3://crabby-images/d4719/d47196d4de3e461356cbe02af8d0f7745cb90548" alt="img"
图3-20
需要提前安装PyMongo库,这是一个提供Python和MongoDB连接的库,使用方法如下。
1.建立连接
输入以下代码,其中localhost是主机名,27017是端口号(在默认情况下是这个参数)。
data:image/s3,"s3://crabby-images/2e653/2e653b82c811bc1bc6c0e99bc79741f96dcfa1f7" alt="img"
2.新建名为weather的数据库
输入以下代码:
data:image/s3,"s3://crabby-images/f22ae/f22ae5e82180bea1d07db59026d29f2e3f517c74" alt="img"
3.新建名为sheet_weather_3的表
输入以下代码:
data:image/s3,"s3://crabby-images/a1d16/a1d16463dcc32c7c1b40fb311aeec5b21c6743ba" alt="img"
4.写入数据
输入以下代码:
data:image/s3,"s3://crabby-images/9d4e8/9d4e81bc4459344ad836a7f4d654c0d3621555fb" alt="img"