在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 教程/ Python/ 拼寫(xiě)檢查
文本翻譯
提取URL地址
處理PDF
塊分類(lèi)
搜索和匹配
大寫(xiě)轉(zhuǎn)換
提取電子郵件地址
字符串的不變性
文本處理狀態(tài)機(jī)
雙字母組
閱讀RSS提要
單詞替換
WordNet接口
重新格式化段落
標(biāo)記單詞
向后讀取文件
塊和裂口
美化打印數(shù)字
拼寫(xiě)檢查
將二進(jìn)制轉(zhuǎn)換為ASCII
文本分類(lèi)
文字換行
頻率分布
字符串作為文件
約束搜索
詞干算法
符號(hào)化
同義詞和反義詞
過(guò)濾重復(fù)的字詞
刪除停用詞
Python文本處理教程
文字摘要
段落計(jì)數(shù)令牌
語(yǔ)料訪(fǎng)問(wèn)
文字改寫(xiě)
文本處理簡(jiǎn)介
處理Word文檔
Python文本處理開(kāi)發(fā)環(huán)境
排序行

拼寫(xiě)檢查

檢查拼寫(xiě)是任何文本處理或分析的基本要求。 python中的pyspellchecker包提供了這個(gè)功能,可以找到可能錯(cuò)誤拼寫(xiě)的單詞,并建議可能的更正。

首先,我們需要在python環(huán)境中使用以下命令安裝所需的包。

pip install pyspellchecker

現(xiàn)在在下面看到如何使用包來(lái)指出錯(cuò)誤拼寫(xiě)的單詞以及對(duì)可能的正確單詞提出一些建議。

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

當(dāng)運(yùn)行上面的程序時(shí),我們得到以下輸出 -

group
{'group', 'ground', 'groan', 'grout', 'grown', 'groin'}
walk
{'flak', 'weak', 'walk'}

區(qū)分大小寫(xiě)
如果使用Let代替let,那么這將成為單詞與字典中最接近的匹配單詞的區(qū)分大小寫(xiě)的比較,結(jié)果現(xiàn)在看起來(lái)不同。

from spellchecker import SpellChecker

spell = SpellChecker()

# find those words that may be misspelled
misspelled = spell.unknown(['Let', 'us', 'wlak','on','the','groun'])

for word in misspelled:
    # Get the one `most likely` answer
    print(spell.correction(word))

    # Get a list of `likely` options
    print(spell.candidates(word))

當(dāng)運(yùn)行上面的程序時(shí),我們得到以下輸出 -

group
{'groin', 'ground', 'groan', 'group', 'grown', 'grout'}
walk
{'walk', 'flak', 'weak'}
get
{'aet', 'ret', 'get', 'cet', 'bet', 'vet', 'pet', 'wet', 'let', 'yet', 'det', 'het', 'set', 'et', 'jet', 'tet', 'met', 'fet', 'net'}

上一篇:單詞替換下一篇:字符串的不變性