在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护。
为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式。在Python中,一个.py文件就称之为一个模块(Module)。
使用模块可以大大提高了代码的可维护性。其次,编写代码不必从零开始。当一个模块编写完毕,就可以被其他地方引用。我们在编写程序的时候,也经常引用其他模块,包括Python内置的模块和来自第三方的模块。
使用模块还可以避免函数名和变量名冲突。相同名字的函数和变量完全可以分别存在不同的模块中,因此,我们自己在编写模块时,不必考虑名字会与其他模块冲突。但是也要注意,尽量不要与内置函数名字冲突。
你也许还想到,如果不同的人编写的模块名相同怎么办?为了避免模块名冲突,Python又引入了按目录来组织模块的方法,称为包(Package)。
举个例子,一个abc.py的文件就是一个名字叫abc的模块,一个xyz.py的文件就是一个名字叫xyz的模块。
现在,假设我们的abc和xyz这两个模块名字与其他模块冲突了,于是我们可以通过包来组织模块,避免冲突。方法是选择一个顶层包名,比如mycompany,按照目录存放。
引入了包以后,只要顶层的包名不与别人冲突,那所有模块都不会与别人冲突。
模块定义好后,我们可以使用 import 语句来引入模块。
1 第三方模块的安装Python有数量庞大的第三方模块支持。对于内置模块,Python可以直接import导入使用,而对于第三方模块,在import导入之前,需要先安装到指定目录:C:\Python\Lib\site-packages。
有多种方法可以安装第三方模块。
1.1 在CMD中用pip命令直接安装
第三方模块添加工具pip必须在安装python3.5时有勾选安装。该命令一般位于安装目录的scripts目录下。
注意pip命令安装第三方模块不是在Python解释器中安装,也不是在IDE或内置的IDLE中安装,而是在CMD(命令提示符)下安装。命令格式如下:
C:\Python\scripts\pip install xlrd
(C:\Python\scripts为pip.exe所在路径,xlrd为第三方模块名。)
上述安装模块的过程其实就是在网站上下载第三方模块到Python的指定目录下。
模块最新的版本并不一定就是最好的选择,如本人就有安装pandas==0.23出现以下错误信息的提示。
import pandas._libsdow as _window
ImportError: DLL load failed: 找不到指定的模块。
使用以下命令格式可以按指定模块版本进行安装:
C:\Python\scripts\pip install pandas==0.22
需要先用以下命令把以前安装的版本卸载掉。C:\Python\scripts\pip uninstall pandas
1.2 在CMD中用pip命令安装WHL文件来安装模块
一些常用的模块可在https://pypi/搜索。
如安装pandas模块的网站地址:https://pypi/project/pandas/#files
可以根据电脑的操作系统、位数、对应python版本号选择相应的whl文件下载。
下载完成后,尽量不要更改文件名。
使用以下命令格式安装:
pip install c:\pandas-0.23.0-cp36-cp36m-win32.whl
1.3 在pycharm中安装模块
编辑或新建C:\Users\wwuhnwu01\pip\pipi:
[global]
respect-virtualenv = true
download-cache = f:/Python/pip/cache
log-file = f:/Python/pip/pip.log
[install]
timeout = 30
find-links = http://pypi.douban
find-links = http://pypi.douban/
pycharm→文件→setting→project interpreter→pip→右边加号+→manage repositories→右边加号+→添加第三方模块的镜像服务器http://pypi.douban/和http://pypi.douban/
(默认的国外的镜像服务器可能不好访问。)
如果还是连接不上第三方模块服务器,有时需要重启一下pycharm。
2 模块卸载在CMD下使用以下命令格式即可以卸载第三方模块。
c:\python\scripts\pip uninstall pandas
3 模块导入3.1 import 模块名 [as 别名]
使用这种方式导入以后,使用时需要在对象之前加上模块名作为前缀,必须以“模块名.对象名”的形式进行访问。如果模块名字很长的话,可以为导入的模块设置一个别名,然后使用“别名.对象名”的方式来使用其中的对象。
3.2 from 模块名 import 对象名[as 别名]
使用这种方式仅导入明确指定的对象,并且可以为导入的对象确定一个别名。这种导入方式可以减少查询次数,提高访问速度,同时也可以减少程序员需要输入的代码量,不需要使用模块名作为前缀名。
3.3 from 模块名 import *
这种方法可以一次导入模块中通过__all__变量指定的所有对象。
这种方式简单粗暴,写起来比较省事,可以直接使用模块中的所有对象而不需要再使用模块名作前缀。但一般并不推荐这样使用。一方面这样会降低代码的可读性,有时很难区分自定义函数和从模块中导入的函数;另一方面,这样导入对象会导致命名空间的混乱。如果多个模块中有同名的对象,只有最后一个导入的模块中的对象是有效的,而之前导入的模块中的同名对象都无法访问,不利于代码的理解和维护。
3.4 模块的搜索路径
当你导入一个模块,Python 解析器对模块位置的搜索顺序是:
当前目录;如果不在当前目录,Python 则搜索在 shell 变量 PYTHONPATH 下的每个目录;如果都找不到,Python会察看默认路径。UNIX下,默认路径一般为/usr/local/lib/python/;模块搜索路径存储在 system 模块的 sys.path 变量中。变量里包含当前目录,PYTHONPATH和由安装过程决定的默认目录。
由上述内容可知,用户自己编写的py文件不能与模块名相同,否则会引发错误。
补充:pip工具的安装、更新I pip工具的安装
如果pip没有连同Python一起安装,也可以下载来安装。
安装说明页面:/d/file/gt/2023-09/kwk3fpjldch c:\Python\get-pip.py
II pip工具的更新
更新pip,可在CMD下使用下面命令:
python -m pip install -U pip
III pip工具的配置
Windows下的pip工具的配置文件的路径:
%HOME%\pip\pipi
如:C:\Users\usersname\pip\pipi
如果无上述路径和文档,可自己建立。
配置文件可以配置pip的安装源,因为pip的服务器在国外,基于国内糟糕的网络环境,有时用pip安装python的第三方模块将是一个很痛苦的过程。好在国内也有pip的镜像源,只需在配置文件中将pip的安装源指向国内的服务器就行了。
[global]
index-url = https://mirrorstc.edu/pypi/web//
#index-url = https://pypi/hustunique/
#index-url = https://pypi.doubanio//
当安装第三方模块不成功时,可切换不同的安装源试一试。
IV 查看pip的版本号与帮助信息
查看pip的版本号与帮助信息,可在CMD中使用pip -V和pip -h命令,如下图所示:
-End-