当前位置:首页 >> 脚本专栏

python新手学习使用库

本文主要介绍下如何使用第三方库。

1. 理解第三方库

Python相当于一个手机,第三方库相当于手机里各种各样的APP。

当我们想搭建网站时,可以选择功能全面的Django、轻量的Flask等web框架;当我们想做一个爬虫时,可以使用Scrapy框架;当我们想做数据分析时,可以选择Pandas数据框架等,这些都是一些很成熟的第三方库。

那么,如何根据自己的需求找到相应的库呢?

可以在 https://awesome-python.com 这个网站上按照分类去查找需要的库。

2. 安装第三方库

这里主要介绍如何在PyCharm中安装第三方库。

1)打开PyCharm——顶部菜单File——选择Default Settings;

2)搜索project interpreter,选择当前Python环境,然后底部点击“+”号添加库;

3)搜索数据库名称——选中该库后点击底部的Install Package,在安装成功后会出现成功提示,此时可以返回到之前的Project Interpreter中查看自己安装的库,点击“-”号可以卸载掉不需要的库。

3. 使用第三方库

使用第三方库时,只要在在PyCharm中输入库之后就可以使用了。输入库用import,比如输入requests库为:import requests。

第一阶段关于Python的基础知识大致先到这里,第二阶段的分享会以Python爬虫为主。

知识点补充:

库使用举例:

jieba库

安装:pip install jieba

中文分词

利用一个中文词库,确定中文字符之间的关联概率

中文字符间概率大的组成词组,形成分词结果除了分词,用户还可以添加自定义的词组(如:司马相如等等这类人名或者专有名词)

三种模式

  1. 精确模式:把文本精确的切分开,不存在冗余单词
  2. 全模式:把文本中所有可能的词语都扫描出来,有冗余
  3. 搜索引擎模式:在精确模式基础上,对长词再次切分
```
jieba.lcut(s)  精确模式,返回一个 列表 类型的分词结果
jieba.lcut("中国是一个伟大的国家") 
['中国', '是', '一个', '伟大', '的', '国家']
```