淺談Python中的字符串
可能大多數(shù)人在學(xué)習(xí)C語言的時(shí)候,最先接觸的數(shù)據(jù)類型就是字符串,因?yàn)榇蠖嘟坛潭际且?Hello world'這個(gè)程序作為入門程序,這個(gè)程序中要打印的'Hello world'就是字符串。如果你做過自然語言處理方面的研究,并且用Python去做過相關(guān)實(shí)驗(yàn),你肯定會(huì)體會(huì)到Python在字符串處理方面相對于其他語言的明顯優(yōu)勢之處。今天我們來了解一下Python中的字符串,看看它的用法。
一.Python中如何聲明字符串
在Python中聲明一個(gè)字符串通常有三種方法:在它的兩邊加上那個(gè)單引號、雙引號或者三引號。
如:
從上面可以看出三種聲明方法的效果是完全一樣的,在Python中用這三種聲明方法來聲明字符串意義完全等同的,即’hello world’和'hello world'以及’’’hello world’’’是沒有任何區(qū)別的。但是會(huì)有人問:既然是完全等同的,為什么要弄出三種聲明方式呢?下面看一下這幾個(gè)例子:
在Python中提供了這幾種方法,使得使用起來更加方便靈活(當(dāng)然也可以使用轉(zhuǎn)義字符去解決上面報(bào)錯(cuò)的地方)。
在這里要注意的是,
1)在Python中沒有類似C語言中char這種類型的字符串,也就是說即使是單個(gè)字符也是字符串。
2)Python中的字符串一旦聲明,是不能進(jìn)行更改的,即不能通過對某一位置重新賦值改變內(nèi)容。
二.Python中的字符串類型
Python中的字符串有兩種數(shù)據(jù)類型:str類型和unicode類型。str類型采用的ASCII編碼,也就是說它無法表示中文。unicode類型采用unicode編碼,能夠表示任意的字符,包括中文、日文、韓文等。
在python中字符串默認(rèn)采用的ASCII編碼,如果要顯示聲明為unicode類型的話,需要在字符串前面加上’u’或者’U’。
下面看一段代碼
print ’我’print u’我’print ’python’print u’python’
這段代碼的運(yùn)行結(jié)果為:
從運(yùn)行結(jié)果可以看出,如果是中文的話,不采用unicode類型,輸出的會(huì)是亂碼。
三.轉(zhuǎn)義字符和原始字符串
同C語言中一樣,Python中也有轉(zhuǎn)義字符,用反斜杠’’來表示對后面字符進(jìn)行轉(zhuǎn)義。
比如上面例子中的問題就可以用轉(zhuǎn)義來解決:
如果你編寫過Java程序,并且使用過Java中的正則表達(dá)式,你可能會(huì)對Java正則表達(dá)式深惡痛絕(我自己就是),因?yàn)樯圆蛔⒁饩蜁?huì)出錯(cuò),里面有太多的轉(zhuǎn)義,而且看起來也很繁瑣雜亂。在Python中,你不必再為這個(gè)問題煩惱了,因?yàn)镻ython提供了原始字符串,顧名思義,就是保留原始字符的意思,不對反斜杠及反斜杠后面的字符進(jìn)行轉(zhuǎn)義,聲明原始字符串的方法是在字符串前面加上’r’或者’R’。
在這里要注意:在Python中行尾結(jié)束符始終為’n’,不論P(yáng)ython程序在哪個(gè)操作系統(tǒng)下運(yùn)行。在Linux環(huán)境下編寫C語言時(shí),換行符為’n’,而在windows下為’rn’。編寫Python程序不用擔(dān)心這種因運(yùn)行環(huán)境不同引起的不兼容問題。
四.用戶輸入以及格式化輸出字符串
在Python中最常用的從鍵盤獲取輸入的函數(shù)是raw_input()和input()。但是這兩個(gè)函數(shù)有很大的區(qū)別:
raw_input()以字符串的形式返回用戶輸入的一切內(nèi)容;
而input()卻不是這樣,它會(huì)根據(jù)輸入內(nèi)容的形式確定返回的形式(可能有點(diǎn)拗口)。下面看個(gè)例子就明白了:
從這個(gè)例子顯而易見可以看出兩者的區(qū)別,同樣輸入123,raw_input()返回的是字符串123,而input()返回的是整數(shù)123。個(gè)人建議一般情況下使用raw_input()獲取輸入,這樣能避免程序中出現(xiàn)一些不必要的麻煩。
同C語言一樣,Python中也提供了格式化輸出。
Python中的格式化輸出和C語言類似,基本格式如下:
print ’....%formmat..’ %(var...)
當(dāng)var只有一個(gè)時(shí),括號可以省略。
關(guān)于Python的字符串今天就討論這么多了,在這里只是討論了基本的概念和知識(shí)點(diǎn),相關(guān)字符串函數(shù)的使用請查閱API文檔。
以上就是淺談Python中的字符串的詳細(xì)內(nèi)容,更多關(guān)于Python中的字符串的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. 解決ajax請求后臺(tái),有時(shí)收不到返回值的問題2. XML入門的常見問題(一)3. 詳談ajax返回?cái)?shù)據(jù)成功 卻進(jìn)入error的方法4. jsp cookie+session實(shí)現(xiàn)簡易自動(dòng)登錄5. .NET使用YARP通過編碼方式配置域名轉(zhuǎn)發(fā)實(shí)現(xiàn)反向代理6. Spring MVC+ajax進(jìn)行信息驗(yàn)證的方法7. 使用Spry輕松將XML數(shù)據(jù)顯示到HTML頁的方法8. XML入門的常見問題(四)9. 一個(gè)用xslt樣式將xml解析為xhtml的類TransformBinder(兼容FF和IE7.0)10. msxml3.dll 錯(cuò)誤 800c0019 系統(tǒng)錯(cuò)誤:-2146697191解決方法
