python批量导入MongoDB数据库
生活随笔
收集整理的這篇文章主要介紹了
python批量导入MongoDB数据库
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
由于源文件不是MongoDB支持的JSON和BSON 格式的數(shù)據(jù), 所以只能將源數(shù)據(jù)轉(zhuǎn)變格式后, 用腳本將其導(dǎo)入,所測數(shù)據(jù)為中科院信工所提供的數(shù)據(jù)。(這也是在信工所接觸的第一個(gè)寫程序的活。)源碼如下:
#!/usr/bin/env python #encoding:utf-8 ################################### # function: analysis the log in the 'die' to JSON , and #output the data to the MongoDB. # data: 2014/3/31 #History: 1.0 ################################### import os import pymongo def connect_mongodb(): servers="mongodb://localhost:27017" conn = pymongo.Connection(servers) print conn.database_names() db = conn.my_mongodb #連接庫 return db def str_process(string,db): d={} if string == '\n': return string2=str(string) print '-----'+string string2=string2.split(' ') print '---------------' print string2 for i in string2: print i print '------------' string2[3].split('\n') d['projectcode']=string2[0] d['pagename']=string2[1] d['pageview']=string2[2] d['bytes']=string2[3][:-1] db.user.insert(d) def file_process(source_file,db): string2='' f=open(source_file,'r') print 'file name :'+source_file while True: string2=f.readline() if string2 == '': break string2=str_process(string2,db) print string2 def get_dir_list(dir): #input the dir ,will output the all filename dat0=[] for i in os.listdir(dir): dat0.append(i) return dat0 def all_file_process(): dir_file_name='' dir_list=[] dir_file_name=raw_input('please input the dir name:') dir_list=get_dir_list(dir_file_name) print dir_list db=connect_mongodb() for i in dir_list: if str(i) != 'log_file_process.py': file_process(str(i),db) all_file_process()最新內(nèi)容請(qǐng)見作者的GitHub頁:http://qaseven.github.io/
總結(jié)
以上是生活随笔為你收集整理的python批量导入MongoDB数据库的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何发挥ERP系统中的财务监控职能?
- 下一篇: 俄罗斯议会下院通过“老大哥”反恐法