本文主要介绍下如何使用第三方库。
1. 理解第三方库
Python相当于一个手机,第三方库相当于手机里各种各样的APP。
当我们想搭建网站时,可以选择功能全面的Django、轻量的Flask等web框架;当我们想做一个爬虫时,可以使用Scrapy框架;当我们想做数据分析时,可以选择Pandas数据框架等,这些都是一些很成熟的第三方库。
那么,如何根据自己的需求找到相应的库呢?
可以在 https://awesome-python.com 这个网站上按照分类去查找需要的库。
2. 安装第三方库
这里主要介绍如何在PyCharm中安装第三方库。
1)打开PyCharm——顶部菜单File——选择Default Settings;
2)搜索project interpreter,选择当前Python环境,然后底部点击“+”号添加库;
3)搜索数据库名称——选中该库后点击底部的Install Package,在安装成功后会出现成功提示,此时可以返回到之前的Project Interpreter中查看自己安装的库,点击“-”号可以卸载掉不需要的库。
3. 使用第三方库
使用第三方库时,只要在在PyCharm中输入库之后就可以使用了。输入库用import,比如输入requests库为:import requests。
第一阶段关于Python的基础知识大致先到这里,第二阶段的分享会以Python爬虫为主。
知识点补充:
库使用举例:
jieba库
安装:pip install jieba
中文分词
利用一个中文词库,确定中文字符之间的关联概率
中文字符间概率大的组成词组,形成分词结果除了分词,用户还可以添加自定义的词组(如:司马相如等等这类人名或者专有名词)
三种模式
- 精确模式:把文本精确的切分开,不存在冗余单词
- 全模式:把文本中所有可能的词语都扫描出来,有冗余
- 搜索引擎模式:在精确模式基础上,对长词再次切分
``` jieba.lcut(s) 精确模式,返回一个 列表 类型的分词结果 jieba.lcut("中国是一个伟大的国家") ['中国', '是', '一个', '伟大', '的', '国家'] ```