Django bulk_create()、update()與數(shù)據(jù)庫事務(wù)的效率對比分析
下面以創(chuàng)建10000個(gè)對象為例進(jìn)行測試:
# 用for循環(huán)挨個(gè)創(chuàng)建,共花費(fèi)37秒 for i in range(10000): name='String number %s'%i Record.objects.create(name=name) # 用django事務(wù)只提交一次,共花費(fèi)2.65秒@transaction.commit_manuallydef manual_transaction(): for i in range(10000): name='String number %s'%i Record.objects.create(name=name) transaction.commit() # 用bulk_create創(chuàng)建,共花費(fèi)0.47秒def builtin(): insert_list =[] for i in range(10000): name='String number %s'%i insert_list.append(Record(name=name)) Record.objects.bulk_create(insert_list) # 用for循環(huán)挨個(gè)更新,共花費(fèi)72秒:def auto_transaction(): for record inRecord.objects.all(): record.name ='String without number' record.save() # 用django事務(wù)只提交一次,共花費(fèi)17秒@transaction.commit_manuallydef manual_transaction(): for record inRecord.objects.all(): record.name ='String without number' record.save() transaction.commit() # 用update更新,共花費(fèi)0.33秒def builtin(): Record.objects.all().update(name='String without number')
補(bǔ)充知識:django的model使用上容易遇到的坑,default=datetime.now和auto_now、null和blank、save和update、bulk_create
一、django設(shè)置字段動(dòng)態(tài)默認(rèn)時(shí)間的四種方式:
from django.db import modelsfrom datetime import datetimeclass User(models.Model): id = models.BigAutoField(’主鍵’, primary_key=True) name = models.CharField(’名字’, max_length=20, db_index=True, default=’’) create_time_one = models.DateTimeField(’創(chuàng)建時(shí)間’, default=datetime.now()) update_time_one = models.DateTimeField(’更新時(shí)間’, default=datetime.now) create_time_tow = models.DateTimeField(’創(chuàng)建時(shí)間’, auto_now_add=True) update_time_tow = models.DateTimeField(’更新時(shí)間’, auto_now=True)
1. default=datetime.now()
model每次初始化,都會自動(dòng)設(shè)置該字段的默認(rèn)值為初始化時(shí)間。
2. default=datetime.now
model每次進(jìn)行新增或修改操作,都會自動(dòng)設(shè)置該字段的值為操作時(shí)間。設(shè)置后仍可以使用ORM手動(dòng)修改該字段。
3. auto_now_add=True
默認(rèn)值為False,若設(shè)置為True,model每次進(jìn)行新增操作,都會自動(dòng)設(shè)置該字段的值為操作時(shí)間。設(shè)置為True后無法使用ORM手動(dòng)修改該字段,哪怕填充了字段的值也會被覆蓋。
4. auto_now=True
默認(rèn)值為False,若設(shè)置為True,model每次進(jìn)行新增或修改操作,都會自動(dòng)設(shè)置該字段的值為操作時(shí)間。設(shè)置為True后無法使用ORM手動(dòng)修改該字段,哪怕填充了字段的值也會被覆蓋。
5. 要注意的點(diǎn)
除非想設(shè)置動(dòng)態(tài)默認(rèn)時(shí)間為項(xiàng)目的啟動(dòng)時(shí)間,否則default=datetime.now()這種用法是錯(cuò)誤的,會得到期望之外的結(jié)果。
使用User.objects.update方法時(shí),設(shè)置的default=datetime.now和auto_now=True都不會生效,由于設(shè)置了auto_now=True的字段不能手動(dòng)修改,此時(shí)只能使用save方法修改數(shù)據(jù),這對于多個(gè)數(shù)據(jù)的更新是不友好的。
因此如果設(shè)置動(dòng)態(tài)默認(rèn)時(shí)間的字段,應(yīng)該使用default=datetime.now和auto_now_add=True來實(shí)現(xiàn)。
二、null=True和blank=True的區(qū)別
1. null針對數(shù)據(jù)庫,如果null=True,表示數(shù)據(jù)庫的該字段可以為空。
2. blank針對表單的,如果blank=True,表示表單填寫該字段時(shí)可以不填。
mysql中空值不占用空間,NULL占用空間,而且使用NULL會使索引的效率下降。因此從性能上來說,不建議使用null=True,最好使用default=’’。
三、save和build_create的區(qū)別
1. 使用save方法:
names = [’張三’, ’李四’]for name in names: user = User(name=name) user.save() print(user.id) # 此時(shí)user對象有id的值
2. 使用bulk_create方法:
names = [’張三’, ’李四’]users = [User(name=name) for name in names]users = User.objects.bulk_create(users)print([user.id for user in users]) # 此時(shí)user對象沒有id的值
bulk_create的優(yōu)點(diǎn):
批量操作時(shí)只與數(shù)據(jù)庫進(jìn)行一次交互,效率高。
bulk_create的缺點(diǎn):
對于設(shè)置了自增的字段,返回值中不會有該字段的值,如上例2中的user對象。
對于設(shè)置了動(dòng)態(tài)默認(rèn)時(shí)間的字段,如設(shè)置了auto_now=True,同一批處理的記錄中該字段的時(shí)間將會相同。
四、上面的知識點(diǎn)使用的例子
1. 定義模型
from django.db import modelsfrom datetime import datetime class User(models.Model): id = models.BigAutoField(’主鍵’, primary_key=True) name = models.CharField(’名字’, max_length=20, db_index=True, blank=False, default=’’) create_time = models.DateTimeField(’創(chuàng)建時(shí)間’, auto_now_add=True) update_time = models.DateTimeField(’更新時(shí)間’, default=datetime.now)
2. 插入數(shù)據(jù)
# 方法一names = [’張三’, ’李四’]users = [User(name=name) for name in names]users = User.objects.bulk_create(users) # 方法二names = [’張三’, ’李四’]users = [User(name=name) for name in names][user.save() for user in users]
3. 修改數(shù)據(jù)
# 方法一names = [’張三’, ’李四’]User.objects.filter(name__in=names).update(name=’changed’, update_time=datetime.now()) # 這里必須顯式對update_time賦值 # 方法二names = [’張三’, ’李四’]users = User.objects.filter(name__in=names)for use in users: user.name = ’changed’ user.save() # 這里會自動(dòng)更新update_time,但是多次save效率低
以上這篇Django bulk_create()、update()與數(shù)據(jù)庫事務(wù)的效率對比分析就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
