机器学习常用到python的自然语言处理框架NLTK,这个是机器学习的常用包,在使用过程中会遇到不少问题。我会和大家分享在这其中的一些经验。
今天闲来说一下安装,在安装中出现的download错误。
>>> import nltk
>>> nltk.download()
NLTK Downloader
---------------------------------------------------------------------------
d) Download l) List c) Config h) Help q) Quit
---------------------------------------------------------------------------
Downloader> l
Packages:
Error connecting to server: [Errno -2] Name or service not known
经过推测,是服务器无法连接下载服务器地址导致的。
查看一下nltk download配置
Downloader> c
Data Server:
- URL: <http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml>
- 3 Package Collections Available
- 74 Individual Packages Available
Local Machine:
- Data directory: /home/wym/nltk_data
然后
> curl http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml
报错:curl: (6) Couldn't resolve host 'nltk.googlecode.com'
google的地址肯定是被墙掉了(唉,大家懂的)
解决办法:
修改dns地址,
> vim /etc/resolv.conf
修改nameserver为: nameserver 8.8.8.8
问题解决