程序師世界是廣大編程愛好者互助、分享、學習的平台,程序師世界有你更精彩!
首頁
編程語言
C語言|JAVA編程
Python編程
網頁編程
ASP編程|PHP編程
JSP編程
數據庫知識
MYSQL數據庫|SqlServer數據庫
Oracle數據庫|DB2數據庫
 程式師世界 >> 編程語言 >> 更多編程語言 >> 更多關於編程 >> Python字符串詳細介紹

Python字符串詳細介紹

編輯:更多關於編程

       這篇文章主要介紹了Python字符串詳解,本文講解了字符串相關知識、字符串的一些特性、原始字符串、unicode字符串、字符串的常用操作方法、內建函數列表等內容,需要的朋友可以參考下

      簡介

      字符串序列用於表示和存儲文本,python中字符串是不可變的,一旦聲明,不能改變

      通常由單引號(' ),雙引號(" ),三引號(''' """)包圍

      其中三引號可以由多行組成,編寫多行文本的快捷語法,常用語文檔字符串,在文件的特定地點,被當做注釋。便捷的多行注釋

      Python實際三類字符串:

      1.通常意義字符串(str)

      2.原始字符串,以大寫R 或 小寫r開始,r'',不對特殊字符進行轉義

      3.Unicode字符串,u'' basestring子類

      在 Python 中,字符串是“不可改變的序列”

      1.不可變

      2.滿足序列基本操作,按位置存取,切片及索引

      字符串

      1.獲得幫助:

       代碼如下:

      >>> help(str)

      >>> dir(str)

      >>> help(str.replace)

      2.不可變性

      在創建之後就不能就地改變(同java),不能通過對其某一位置進行賦值而改變字符劃分為不可變序列,這些字符串所包含的字符存在從左到右的順序,不可在原處修改。python中字符串相當於一個不可變序列的列表,一旦聲明,每個字符位置固定

      意味著若想改變,必須新建一個!

       代碼如下:

      >>>s='spam'

      >>>s[0]='k' #TypeError

      #修改字符串類似java,重新賦值

      s = ‘k' + s[1:]

      原始字符串

      原始字符串常量,r”abcd”,(r/R)即去掉了反斜線轉義機制。關閉轉義機制,即不再表示轉義

      用處:

      1.正則表達式

      用於處理正則表達式,減少反斜槓

       代碼如下:

      p4search = re.compile(r's*')

      2.系統路徑

      可以方便地表示系統路徑

       代碼如下:

      path = r'e:book'

      unicode字符串

      Unicode是書寫國際文本的標准方法。

      Python允許你處理Unicode文本——你只需要在字符串前加上前綴u或U。例如,u"This is a Unicode string."

      BP: 在你處理文本文件的時候使用Unicode字符串,特別是當你知道這個文件含有用非英語的語言寫的文本。

      常用操作

      1.基本操作

       代碼如下:

      + :string1+string2 #聯接字符串,將後一個串鏈接到前一個串的後面

      Python不允許在+表達式中出現其他類型,需要手工轉【這點不同於java】‘abc'+str(9)

      * :string*n #創建一個新字符串重復n次原來的串

      [] :string[n] #從字符串中獲取對應位置的一個字符

      [:] :string[n:m] #截取字符串,如果為:m從頭到m如果為n:從n到尾

      in :char in string #判斷一個字符是否在串中,如果在返回為真(True)

      not in :char not in string #判斷一個字符是否不在串中,如果在返回為真(True)

      r/R : r/Rstring #禁止轉義字符的實際意義,整個字符為原始意義

      len() : 長度len(s)

      2.類型轉換

      字符串和數字相互轉換

      字符串到數字int/float/long

      數字到字符串str

       代碼如下:

      >>> int(42)

      42

      >>> int('42')

      42

      >>> str(42)

      '42'

      >>> float('42.0')

      42.0

      >>> str(42.0)

      '42.0'

      或者使用string模塊的函數

      s:進行轉換的字符串, base:可選,目標進制

       代碼如下:

      import string

      string.atoi(s[,base]) #base默認為10,如果為0,那麼s就可以是012或0x23這種形式的字符串,如果是16那麼s就只能是0x23或0X12這種形式的字符串


      string.atol(s[,base]) #轉成long

      string.atof(s[,base]) #轉成float

      字符串和列表的轉換

      字符串轉列表:

       代碼如下:

      s='spam'

      l = list(s)

      l2 = "hello world".spilt()

      列表轉字符串

      復制代碼 代碼如下:

      k = ‘'.join(l)

      注意,不能join列表中的非字符串

      3.修改字符串

       代碼如下:

      s = s + 'a'

      s = s[3:] + ‘b'

      s = s.replace(‘pl','pa')

      a = '' #賦值空

      del a #整個變量刪除

      4.索引和分片

      索引s[i]

       代碼如下:

      s[0]首個

      s[-1] = s[len(s)-1] 倒數第一個

      分片s[i:j]

       代碼如下:

      不含上邊界,s[1:3] 取[1-2]

      s[1:]取1到結束 s[:3] 取開始到2

      s[:-1]開始到倒數第二個

      s[:]開始到結尾,相當於一個復制

      s[1:10:2] 取1-9,步長=2

      s[a:b:-2] 步長為負數,兩個邊界意義反轉了,表示從b+1到a,步長-2

      s='abcdefg'

      s[5:1:-1] 得到 fedc

      s[1:3] == s[slice(1,3)] 內置函數

      字符串格式化

      這裡只介紹基本字符串格式化,擴展在後續篇幅介紹%c 單個字符%d 十進制整數%o 八進制整數%s 字符串%x 十六進制整數,其中字母小寫%X 十六進制整數,其中字母大寫

       代碼如下:

      >>> str = "so %s a day!"

      >>> str % 'beautiful'

      'so beautiful a day!'

      >>> '{0} is {1}'.format('a','b')

      'a is b'

      >>> template = "{0}, {1} and {2}"

      >>> template.format('a', 'b', 'c')

      'a, b and c'

      內建函數列表

      【字符串方法是python文本處理頭號工具】

      string.capitalize()

      字符串第一個字符大寫

      string.center(width,[,fill])

      原字符居中,空格填充至width長度

      string.count(str,beg=0,end=len(string))

      獲得字符串中某一個子串的數目,計算出現次數,可指定范圍

      string.decode(encoding='UTF-8',errors='strict')

      解碼字符串,出錯默認報ValueError,除非errors是ignore或replace

      string.encode(encoding='UTF-8',errors='strict')

      string.endswith(suffix,beg=0,end=len(string))

      是否以**結尾

      string.expandtabs(tabsize=8)

      把字符串中tab轉為空格,默認8個

      string.find(str,beg=0,end=len(stirng))

      檢測是否包含str,存在返回開始索引,否則返回-1

      string.index(str,begin=0,end=len(string))

      同find,不存在報異常,ValueError

      string.isalnum()

      至少一個字符,且所有字符均為字母或數字,True. 檢測字符串是否只包含0-9A-Za-z

      string.isalpha()

      至少一個字符,所有字符都是字母,True. 檢測字符串是否只包含字母

      string.isdecimal()

      只包含十進制數,True

      stirng.isdigit()

      只包含數字,True. 檢測字符串是否僅包含數字

      string.islower()

      至少一個區分大小寫字符且所有字符小寫,True. 檢測字符串是否均為小寫字母

      string.isnumeric()

      只含數字字符,True

      string.isspace()

      只包含空格,True. 檢測字符串是否均為空白字符

      string.istitle()

      標題化字符,True. 檢測字符串中的單詞是否為首字母大寫

      string.isupper()

      至少一個區分大小寫字符且所有字符大寫,True. 檢測字符串是否均為大寫字母

      string.join(seq)

      以string作為分隔符,seq中所有元素合並為新的字符串. 將原字符串插入參數字符串中的每兩個字符之間

      string.ljust(width)

      返回一個原字符串左對齊,空格補充至長度width

      string.lower()

      轉小寫. 將字符串全部轉為小寫

      string.lstrip()

      截掉左側的空格

      string.partition(str)

      = find+split,從str出現第一個位置,截斷為pre_str,str,after_str元組,不含str則pre_str=strstring.replace(str1,str2,num=string.count(str1))替換,指定不超過num次,可作為模板實現

      string.rfind(str,beg=0,end=len(string))

      同find,右邊開始

      string.rindex(str,beg=0,end=len(string))

      同index,右邊開始

      string.rjust(width)

      右對齊,空格補齊

      string.rpartition(str)

      同partition,右邊開始

      string.rstrip([chars])

      清理右側空白,包括換行符,返回處理後字符串

      string.split(str=””, maxsplit =string.count(str))

      以str切片,可指定分割次數, 分割字符串,返回列表,默認分隔符空格

      string.splitlines(num=string.count(‘n'))

      s.splitlines([keepends])按行分隔,可指定分割次數

      string.startswith(obj,beg=0,end=len(string))

      以str開頭,True. 檢測字符串是否以某一子串開頭

      string.strip([obj])

      在string上執行lstrip和rstrip

      string.swapcase

      反轉string中大小寫. 字符串中小寫轉大寫,大寫轉小寫

      string.title()

      標題花,單詞首字母大寫,其余小寫

      string.translate(str,del=””)

      s.translate(table)根據str給出表轉換string字符,要過濾的字符放在del參數中

      string.upper()

      轉大寫. 將字符串全部轉為大寫

      string.zfill(width)

      返回長度width的字符串,原字符串右對齊,前面填充0

      len(string)

      獲取字符串的長度

      最佳實踐

      1.循環中用到長度

       代碼如下:

      while i < len(stri):

      #修改

      size = len(stri)

      while i < size

      2.字符串追加

      復制代碼 代碼如下:

      l = ['a', 'b']

      result = ''

      for i in l:

      result += i

      #修改

      result = ''.join(l)

      其他

      1.轉義符

      幾個常用:

      n換行,反斜槓

      t制表 '單引號

      r回車 "雙引號

      後續需擴展

      字符串編碼詳解

      字符串格式化

      正則表達式

      字符串涉及常用模塊(序列化/文本包裝等)

    1. 上一頁:
    2. 下一頁:
    Copyright © 程式師世界 All Rights Reserved