初学 Python 者自学 Anaconda 的正确姿势是什么?

我是一个python的初学者,苦于装各种各样的module装了anaconda(py36),结果进了一个更大的坑。我不知道如何去区分各种各样的库,受累…
关注者
4,873
被浏览
3,599,827

69 个回答

事实上Anaconda 和 Jupyter(包括Jupyter Notebook和JupyterLab,其中JupyterLab是从Notebook发展而来的)已成为数据分析的标准环境。

简单来说,Anaconda是包管理器和环境管理器,Jupyter可以将数据分析的代码、图像和文档全部组合到一个web文档中。


接下来我详细介绍下Anaconda,并在最后给出Jupyter(以Notebook为例) :

1.Anaconda是什么?

2.如何安装?

3. 如何管理包?

4.Jupyter notebook如何快速上手?


不过在开始前我需要强调下,下面的步骤你要亲自跟着敲一遍并在自己的电脑上实践。虽然下面你会遇到很多命令,给了谁都记不住的。但是别怕,也别中途放弃,因为你没必要记住命令,因为当你在后面学习数据分析用的多了,自然就记住了。

记不住也没关系,学会在哪查找就可以了。你只需要跟着上面步骤操作下,并理解了每一步是干什么的就可以了。后面遇到要做的事情,忘记了回头查这个文档就可以了。

刚开始学习的过程就像下面这个图,只要中途不放弃,自己实际操作一遍,我保证你可以熟练上手。

1.Anaconda是什么?

Anaconda在英文中是“蟒蛇”,有首歌就叫《Anaconda》,表示像蟒蛇一样性感妖娆的身体。

所有你看下面Anaconda的图标就像一个收尾互相咬住的“蟒蛇”。

你可能已经安装了 Python,那么为什么还需要 Anaconda?有以下3个原因:

1)Anaconda 附带了一大批常用数据科学包,它附带了 conda、Python 和 150 多个科学包及其依赖项。因此你可以立即开始处理数据。

2)管理包

Anaconda 是在 conda(一个包管理器和环境管理器)上发展出来的。

在数据分析中,你会用到很多第三方的包,而conda(包管理器)可以很好的帮助你在计算机上安装和管理这些包,包括安装、卸载和更新包。

3)管理环境

为什么需要管理环境呢?

比如你在A项目中用了 Python 2,而新的项目B老大要求使用Python 3,而同时安装两个Python版本可能会造成许多混乱和错误。这时候 conda就可以帮助你为不同的项目建立不同的运行环境。


还有很多项目使用的包版本不同,比如不同的pandas版本,不可能同时安装两个 Numpy 版本,你要做的应该是,为每个 Numpy 版本创建一个环境,然后项目的对应环境中工作。这时候conda就可以帮你做到。


2. 如何安装Anaconda?

Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)。你可以在下面地址上找到安装程序和安装说明。根据你的操作系统是32位还是64位选择对应的版本下载。

官网地址:docs.anaconda.com/anaco


Anaconda 的下载文件比较大(约 500 MB),因为它附带了 Python 中最常用的数据科学包。

如果计算机上已经安装了 Python,安装不会对你有任何影响。实际上,脚本和程序使用的默认 Python 是 Anaconda 附带的 Python,所以安装完Anaconda已经自带安装好了Python,不需要你再安装Python了。

注意:如果你是windows 10系统,注意在安装Anaconda软件的时候,右击安装软件→选择以管理员的身份运行。


3.如何管理包?

安装了 Anaconda 之后,就可以很方便的管理包了(安装,卸载,更新)。

按下图点击菜单栏,打开Anaconda Navigator

然后在Anaconda Navigator中按下图操作

1)列出已安装的包

2)安装或者更新包

下图中第5步,“apply”表示安装这个包,‘clear’表示删除已经安装的包。

如果没有“apply” 这个按钮,表示这个包已经安装过了。


3)如果遇到需要输入conda命令的,可以按下图打开conda的命令端,然后输入命令

按照上面的步骤你亲自操作一遍后,你已经学会了Anaconda,并安装好你的数据分析Pyhton环境了,接下来你就可以愉快的使用Jupyter notebook来做数据分析了:

其他常见问题,见这里:


Anaconda的优势之处在于小白也能快速上手

我们知道Python的英文表达是蟒蛇,有意思的是anaconda也是蟒蛇的意思,准确是是水莽,莽中之王,更大、更重、更长。按这层意思理解,anaconda是python的大码款,倒也是有些贴切的。

Anaconda知多少

回到编程,Anaconda对于初学Python的人很友好,一键安装,不必费心配置python环境,也不用安装各种常用的库,就可以直接入手使用。对于数据科学来说,Anaconda是一个百宝箱式的存在。

Anaconda是一个免费开源的Python和R语言的发行版本,用于计算科学(数据科学、机器学习、大数据处理和预测分析),Anaconda致力于简化包管理和部署。Anaconda的包使用软件包管理系统Conda进行管理。超过1200万人使用Anaconda发行版本,并且Anaconda拥有超过1400个适用于Windows、Linux和MacOS的数据科学软件包。

总结Anaconda的三大特点:

  1. 内置python,高度集成python数据科学生态
  2. 拥有强大的包管理工具-conda
  3. 可用超过600个python数据科学库

Anaconda拥有个人版、商业版、团队版、企业版,除个人版不收费外,其他版本都需要付费,

当然对大部分人来说个人版已经完全够用。和python一样,Anaconda不挑平台,在windows、os、linux上都可以用,目前支持python3.8版本的下载 ,下载完成后一路next就能完成安装。

官网:

Anaconda | The World's Most Popular Data Science Platform

下载地址:

Anaconda | Individual Edition

安装教程:

Installation - Anaconda documentation

学习文档:

Anaconda Documentation

Anaconda能做什么

前面说过Anaconda是一个python数据科学百宝箱,所以它的作用就是燃爆数据科学,让小白也可以轻松玩数据。

你可以利用Anaconda研究数据处理、数据建模、机器学习、神经网络、自然语言处理、可视化展示、教学等等。既能一人独秀,也可以团队作战。

当然这些都是依托于python的,首先你得会撸代码。

神奇的conda

说说conda,这是Anaconda的杀手锏。

Conda是一个开源、跨平台和语言无关的软件包管理和系统管理系统,通过Conda可安装、升级和升级软件包依赖。Conda为Python程序创造,但是它可以打包、分发任意语言编写的软件(例如R语言)和包含多语言的项目。

conda和pip都可以管理python库,但最大的不同在于conda是跨平台且不限语言的,而且可以独自创建虚拟环境。因为conda立足于数据科学生态,不像pip可以安装几乎所有的python库(来自pypl),conda只能安装anaconda里支持的数据科学库(600多个)。

主要的数据科学内置库包括pandas、numpy、matplotlib、jupyter、scipy、ipython、nltk、notebook、sikit-learn、seaborn、xlrd、xlwt......

一般把这些数据科学库分为四大类:基础库(jupyter、pandas、numpy、scipy),机器学习库(keras、tensorflow、pytorch、sikit-learn、nltk),可视化库(matplotlib、seaborn、plotly)、拓展计算库(numba、dask、pyspark)

这些库可以通过conda安装,也可以在GUI界面Navigator上点击安装或更新。

有兴趣可以去官网看看这些神奇的家伙:Anaconda库大全

附conda文档:Conda - Conda documentation

另外Anaconda还有其他的优秀的特性

  • 拥有界面化的应用程序及包管理应用-Navigator
  • 支持R语言

Anaconda不仅适用于Python,还支持R,使用conda安装R并管理R包

  • 学习社区

Anaconda的缺点

Anaconda的优点也是它的缺点,功能太齐全就显得很臃肿,一个安装包快500M,所以不少人去拥抱miniconda了。但无论如何,Anaconda都是python数据科学最好的伙伴。