Python程序員的30個(gè)常見(jiàn)錯(cuò)誤
18. 不要試圖從那些會(huì)改變對(duì)象的函數(shù)得到結(jié)果
本文引用地址:http://www.ex-cimer.com/article/201901/396507.htm諸如像方法list.append()和list.sort()一類的直接改變操作會(huì)改變一個(gè)對(duì)象,但不會(huì)將它們改變的對(duì)象返回出來(lái)(它們會(huì)返回None);正確的做法是直接調(diào)用它們而不要將結(jié)果賦值。經(jīng)常會(huì)看見(jiàn)初學(xué)者會(huì)寫(xiě)諸如此類的代碼:
mylist = mylist.append(X)
目的是要得到append的結(jié)果,但是事實(shí)上這樣做會(huì)將None賦值給mylist,而不是改變后的列表。更加特別的一個(gè)例子是想通過(guò)用排序后的鍵值來(lái)遍歷一個(gè)字典里的各個(gè)元素,請(qǐng)看下面的例子:
D = {...}
for k in D.keys().sort(): print D[k]
差一點(diǎn)兒就成功了——keys方法會(huì)創(chuàng)建一個(gè)keys的列表,然后用sort方法來(lái)將這個(gè)列表排序——但是因?yàn)閟ort方法會(huì)返回None,這個(gè)循環(huán)會(huì)失敗,因?yàn)樗鼘?shí)際上是要遍歷None(這可不是一個(gè)序列)。要改正這段代碼,將方法的調(diào)用分離出來(lái),放在不同的語(yǔ)句中,如下:
Ks = D.keys()
Ks.sort()
for k in Ks: print D[k]
19. 只有在數(shù)字類型中才存在類型轉(zhuǎn)換
在Python中,一個(gè)諸如123+3.145的表達(dá)式是可以工作的——它會(huì)自動(dòng)將整數(shù)型轉(zhuǎn)換為浮點(diǎn)型,然后用浮點(diǎn)運(yùn)算。但是下面的代碼就會(huì)出錯(cuò)了:
S = "42"
I = 1
X = S + I # 類型錯(cuò)誤
這同樣也是有意而為的,因?yàn)檫@是不明確的:究竟是將字符串轉(zhuǎn)換為數(shù)字(進(jìn)行相加)呢,還是將數(shù)字轉(zhuǎn)換為字符串(進(jìn)行聯(lián)接)呢?在Python中,我們認(rèn)為“明確比含糊好”(即,EIBTI(Explicit is better than implicit)),因此你得手動(dòng)轉(zhuǎn)換類型:
X = int(S) + I # 做加法: 43
X = S + str(I) # 字符串聯(lián)接: "421"
20. 循環(huán)的數(shù)據(jù)結(jié)構(gòu)會(huì)導(dǎo)致循環(huán)
盡管這在實(shí)際情況中很少見(jiàn),但是如果一個(gè)對(duì)象的集合包含了到它自己的引用,這被稱為循環(huán)對(duì)象(cyclic object)。如果在一個(gè)對(duì)象中發(fā)現(xiàn)一個(gè)循環(huán),Python會(huì)輸出一個(gè)[…],以避免在無(wú)限循環(huán)中卡住:
>>> L = ['grail'] # 在 L中又引用L自身會(huì)
>>> L.append(L) # 在對(duì)象中創(chuàng)造一個(gè)循環(huán)
>>> L
['grail', [...]]
除了知道這三個(gè)點(diǎn)在對(duì)象中表示循環(huán)以外,這個(gè)例子也是很值得借鑒的。因?yàn)槟憧赡軣o(wú)意間在你的代碼中出現(xiàn)這樣的循環(huán)的結(jié)構(gòu)而導(dǎo)致你的代碼出錯(cuò)。如果有必要的話,維護(hù)一個(gè)列表或者字典來(lái)表示已經(jīng)訪問(wèn)過(guò)的對(duì)象,然后通過(guò)檢查它來(lái)確認(rèn)你是否碰到了循環(huán)。
21. 賦值語(yǔ)句不會(huì)創(chuàng)建對(duì)象的副本,僅僅創(chuàng)建引用
這是Python的一個(gè)核心理念,有時(shí)候當(dāng)行為不對(duì)時(shí)會(huì)帶來(lái)錯(cuò)誤。在下面的例子中,一個(gè)列表對(duì)象被賦給了名為L(zhǎng)的變量,然后L又在列表M中被引用。內(nèi)部改變L的話,同時(shí)也會(huì)改變M所引用的對(duì)象,因?yàn)樗鼈儌z都指向同一個(gè)對(duì)象。
>>> L = [1, 2, 3] # 共用的列表對(duì)象
>>> M = ['X', L, 'Y'] # 嵌入一個(gè)到L的引用
>>> M
['X', [1, 2, 3], 'Y']
>>> L[1] = 0 # 也改變了M
>>> M
['X', [1, 0, 3], 'Y']
通常情況下只有在稍大一點(diǎn)的程序里這就顯得很重要了,而且這些共用的引用通常確實(shí)是你需要的。如果不是的話,你可以明確的給他們創(chuàng)建一個(gè)副本來(lái)避免共用的引用;對(duì)于列表來(lái)說(shuō),你可以通過(guò)使用一個(gè)空列表的切片來(lái)創(chuàng)建一個(gè)頂層的副本:
>>> L = [1, 2, 3]
>>> M = ['X', L[:], 'Y'] # 嵌入一個(gè)L的副本
>>> L[1] = 0 # 僅僅改變了L,但是不影響M
>>> L
[1, 0, 3]
>>> M
['X', [1, 2, 3], 'Y']
切片的范圍起始從默認(rèn)的0到被切片的序列的最大長(zhǎng)度。如果兩者都省略掉了,那么切片會(huì)抽取該序列中的所有元素,并創(chuàng)造一個(gè)頂層的副本(一個(gè)新的,不被公用的對(duì)象)。對(duì)于字典來(lái)說(shuō),使用字典的dict.copy()方法。
22. 靜態(tài)識(shí)別本地域的變量名
Python默認(rèn)將一個(gè)函數(shù)中賦值的變量名視作是本地域的,它們存在于該函數(shù)的作用域中并且僅僅在函數(shù)運(yùn)行的時(shí)候才存在。從技術(shù)上講,Python是在編譯def代碼時(shí),去靜態(tài)的識(shí)別本地變量,而不是在運(yùn)行時(shí)碰到賦值的時(shí)候才識(shí)別到的。
如果不理解這點(diǎn)的話,會(huì)引起人們的誤解。比如,看看下面的例子,當(dāng)你在一個(gè)引用之后給一個(gè)變量賦值會(huì)怎么樣:
>>> X = 99
>>> def func():
... print X # 這個(gè)時(shí)候還不存在
... X = 88 # 在整個(gè)def中將X視作本地變量
...
>>> func( ) # 出錯(cuò)了!
你會(huì)得到一個(gè)“未定義變量名”的錯(cuò)誤,但是其原因是很微妙的。當(dāng)編譯這則代碼時(shí),Python碰到給X賦值的語(yǔ)句時(shí)認(rèn)為在這個(gè)函數(shù)中的任何地方X會(huì)被視作一個(gè)本地變量名。
但是之后當(dāng)真正運(yùn)行這個(gè)函數(shù)時(shí),執(zhí)行print語(yǔ)句的時(shí)候,賦值語(yǔ)句還沒(méi)有發(fā)生,這樣Python便會(huì)報(bào)告一個(gè)“未定義變量名”的錯(cuò)誤。
事實(shí)上,之前的這個(gè)例子想要做的事情是很模糊的:你是想要先輸出那個(gè)全局的X,然后創(chuàng)建一個(gè)本地的X呢,還是說(shuō)這是個(gè)程序的錯(cuò)誤?如果你真的是想要輸出這個(gè)全局的X,你需要將它在一個(gè)全局語(yǔ)句中聲明它,或者通過(guò)包絡(luò)模塊的名字來(lái)引用它。
23. 默認(rèn)參數(shù)和可變對(duì)象
在執(zhí)行def語(yǔ)句時(shí),默認(rèn)參數(shù)的值只被解析并保存一次,而不是每次在調(diào)用函數(shù)的時(shí)候。這通常是你想要的那樣,但是因?yàn)槟J(rèn)值需要在每次調(diào)用時(shí)都保持同樣對(duì)象,你在試圖改變可變的默認(rèn)值(mutable defaults)的時(shí)候可要小心了。
例如,下面的函數(shù)中使用一個(gè)空的列表作為默認(rèn)值,然后在之后每一次函數(shù)調(diào)用的時(shí)候改變它的值:
>>> def saver(x=[]): # 保存一個(gè)列表對(duì)象
... x.append(1) # 并每次調(diào)用的時(shí)候
... print x # 改變它的值
...
>>> saver([2]) # 未使用默認(rèn)值
[2, 1]
>>> saver() # 使用默認(rèn)值
[1]
>>> saver() # 每次調(diào)用都會(huì)增加!
[1, 1]
>>> saver()
[1, 1, 1]
有的人將這個(gè)視作Python的一個(gè)特點(diǎn)——因?yàn)榭勺兊哪J(rèn)參數(shù)在每次函數(shù)調(diào)用時(shí)保持了它們的狀態(tài),它們能提供像C語(yǔ)言中靜態(tài)本地函數(shù)變量的類似的一些功能。
但是,當(dāng)你第一次碰到它時(shí)會(huì)覺(jué)得這很奇怪,并且在Python中有更加簡(jiǎn)單的辦法來(lái)在不同的調(diào)用之間保存狀態(tài)(比如說(shuō)類)。
要擺脫這樣的行為,在函數(shù)開(kāi)始的地方用切片或者方法來(lái)創(chuàng)建默認(rèn)參數(shù)的副本,或者將默認(rèn)值的表達(dá)式移到函數(shù)里面;只要每次函數(shù)調(diào)用時(shí)這些值在函數(shù)里,就會(huì)每次都得到一個(gè)新的對(duì)象:
>>> def saver(x=None):
... if x is None: x = [] # 沒(méi)有傳入?yún)?shù)?
... x.append(1) # 改變新的列表
... print x
...
>>> saver([2]) # 沒(méi)有使用默認(rèn)值
[2, 1]
>>> saver() # 這次不會(huì)變了
[1]
>>> saver()
[1]
24. 其他常見(jiàn)的編程陷阱
下面列舉了其他的一些在這里沒(méi)法詳述的陷阱:
在頂層文件中語(yǔ)句的順序是有講究的:因?yàn)檫\(yùn)行或者加載一個(gè)文件會(huì)從上到下運(yùn)行它的語(yǔ)句,所以請(qǐng)確保將你未嵌套的函數(shù)調(diào)用或者類的調(diào)用放在函數(shù)或者類的定義之后。
reload不影響用from加載的名字:reload最好和import語(yǔ)句一起使用。如果你使用from語(yǔ)句,記得在reload之后重新運(yùn)行一遍from,否則你仍然使用之前老的名字。
在多重繼承中混合的順序是有講究的:這是因?yàn)閷?duì)superclass的搜索是從左到右的,在類定義的頭部,在多重superclass中如果出現(xiàn)重復(fù)的名字,則以最左邊的類名為準(zhǔn)。
在t 888888 ry語(yǔ)句中空的except子句可能會(huì)比你預(yù)想的捕捉到更多的錯(cuò)誤。在try語(yǔ)句中空的except子句表示捕捉所有的錯(cuò)誤,即便是真正的程序錯(cuò)誤,和sys.exit()調(diào)用,也會(huì)被捕捉到。
評(píng)論