博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第三次作业
阅读量:5261 次
发布时间:2019-06-14

本文共 991 字,大约阅读时间需要 3 分钟。

2017**********7025

贾鸿森

def process_file(dst): # 读文件到缓冲区

try: # 打开文件
x = open(dst,"r")
except IOError as s:
print (s)
return None
try: # 读文件到缓冲区
bvffer = x.read()
except:
print ('Read File Error!')
return None
x.close()

return bvffer

def process_buffer(bvffer):
if bvffer:
word_freq = {}
# 下面添加处理缓冲区 bvffer代码,统计每个单词的频率,存放在字典word_freq
for ch in'"!?;,."':
bvffer = bvffer.lower().replace(ch,"")
word = bvffer.strip().split()
for word in word:
word_freq[word] = word_freq.get(word,0)+1

return word_freq

def output_result(word_freq):
if word_freq:
sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
for item in sorted_word_freq[:10]: # 输出 Top 10 的单词
print(item)

if __name__ == "__main__":

import argparse

parser = argparse.ArgumentParser()
parser.add_argument('dst')
args = parser.parse_args()
dst = args.dst
bvffer = process_file(dst)
word_freq = process_buffer(bvffer)
output_result(word_freq)

 

 

 通过这次作业我掌握了这种查询方法

转载于:https://www.cnblogs.com/Gjiahongsen/p/10609993.html

你可能感兴趣的文章
站立会议第四天
查看>>
如何快速掌握一门技术
查看>>
利用AMPScript获取Uber用户数据的访问权限
查看>>
vagrant 同时设置多个同步目录
查看>>
python接口自动化28-requests-html爬虫框架
查看>>
生成随机数的模板
查看>>
hdu 2093
查看>>
Mysql 数据库操作
查看>>
转:linux终端常用快捷键
查看>>
009.栈实现队列
查看>>
A-Softmax的总结及与L-Softmax的对比——SphereFace
查看>>
关于软件盘覆盖住布局
查看>>
Unity3D 控制物体移动、旋转、缩放
查看>>
UVa 11059 最大乘积
查看>>
UVa 12545 比特变换器
查看>>
数组分割问题求两个子数组的和差值的小
查看>>
10个著名的思想实验1
查看>>
composer 报 zlib_decode(): data error
查看>>
linux下WPS的使用
查看>>
java 中 finally里面写了return 会发生什么?
查看>>