关于python2.7的md5加密遇到的问题（TypeError: Unicode-objects must be encoded before hashing)

602 wiki 2022-01-14

https://blog.csdn.net/u012087740/article/details/48439559import hashlibimport sysdef md5s():m=hashlib.md5()strs=sys.argv[1]m.update(strs.encode("utf8"))print(m.hexdigest())if __name__=='__main__':md5s()注意update()必须指定要加密的字符串的字符编码

python Python

爬虫提取非结构化数据

592 wiki 2022-01-14

pdf：pdfBox解析pdf文档word：poirtf：rtfconverter4jexcel：jxl,poi，数据库访问jsqlparserpowerpoint：poi图片：javax.imageio.Imageio? ? ? ? 二值化：

python Python

python2 'str' object has no attribute 'decode'

623 wiki 2022-01-14

'0102030405060708'.decode('hex')上述代码，报错：'str' object has no attribute 'decode'查找原因：https://stackoverflow.com/questions/29030725/str-object-has-no-attribute-decodeYou cannot decode string objects; they are?already?decoded. You'll have to use a different method.You can use the?codecs.decode()?function?to apply?hex?as a codec:>>> import codecs>>> codecs.decode('ab', 'hex')b'xab'This applies a?Binary transform?codec; it is the equivalent of using the?base64.b16decode()?function, with the input string converted to uppercase:>>> import base64>>> base64.b16decode('AB')b'xab'You can also use the?binascii.unhexlify()?function?to 'decode' a sequence of hex digits to bytes:>>> import binascii>>> binascii.unhexlify('ab')b'xab'Either way, you'll get a?bytes?object.?使用第二种方式解决了:>>> import base64>>> base64.b16decode('AB')

python Python

python – 是一个无限的循环不良练??习？

562 wiki 2022-01-14

我正在用Python实现一个纸牌游戏,为了我的班级来处理玩家,PlayerHandler,我最近实现了__next__来简单地调用next_player.因为游戏玩法可以被认为是无限循环(玩家将继续玩,直到他们退出或赢/输),它停止迭代是没有意义的.但是,如果for循环导致无限循环,那么它可能会让人感到困惑,所以我应该在某个地方引发StopIteration

python Python

java.net.URISyntaxException: Illegal character in query

674 wiki 2022-01-14

java使用httpclient爬取一个网站的时候，请求：String url3="http://sh.58.com/ershoufang/33562546149042x.shtml?amp;params=esfjxpclranxuanctrAB^desc&fzbref=0&entinfo=33562546149042_0&cookie=|||c5/nn1jLReK730pAPL8MAg==&psid=108219688199520000030035316&pubid=29787816&local=2&apptype=0&from=1-list-0&key=&trackkey=33562546149042_17b444ec-825b-41c6-9939-e85c0c1e45e4_20180328143317_1522218797570&fcinfotype=gz";报错：java.net.URISyntaxException: Illegal character in query现象：使用浏览器访问是ok的? ? ? ? ? httpclient报错原因是：特殊字符问题解决方式：url转为uri，测试还是报错，最近将uri转成uri.toString才okURL url = new URL(strUrl);URI uri = new URI(url.getProtocol(), url.getHost(), url.getPath(), url.getQuery(), null);System.out.println("uri : "+uri.toString());HttpGet httpget = new HttpGet(uri.toString());

python Python

selenium打开chrome浏览器代码

650 wiki 2022-01-14

import osfrom selenium import webdriverchromedriver = "C:Program Files (x86)GoogleChromeApplicationchrome.exe"os.environ["webdriver.chrome.driver"] = chromedriverdriver = webdriver.Chrome(chromedriver)driver.quit()

python Python

主流的Python领域和框架--转

596 wiki 2022-01-14

原文地址：https://www.zhihu.com/question/19899608

python Python

爬虫推荐的工具

601 wiki 2022-01-14

爬虫推荐的工具：pyspider,BeautifulSouprequestsscrapymongodbrediskafka.repyV8：python执行js的插件phatomjs：一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web 标准：DOM 操作，CSS选择器，JSON，Canvas 以及SVGselenium：是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。一开始推荐学习框架，比如scrapy或者Pyspider数据分析：pandasscikit-learnspark.ntlkjiebapandas主要是处理金融数据得力，scikit-learn用来进行机器学习，spark是分布式计算。nltk进行予以分析。jieba用来做中文分词。

python Python

Object moved to here.

596 wiki 2022-01-14

python Python

python学习之解决中英文混合输出的排版问题

622 wiki 2022-01-14

在python的格式输出时常使用format()方法，其中的多余空间默认使用英文空格作为占位符，不方便中英混合时的格式输出，因此我们要为其中的中文字符串使用占字符较大的中文空格符作为多余空间的占位符。?chr(12288)返回的是中文空格符，因此我们在格式输出时可以使用chr(12288)作为fornat()函数的占位符。例如：tplt = "{:^5}t{:{ocp}^12}t{:{ocp}^5}t{:^5}"#方便中文对其显示，使用中文字宽作为站字符，chr(12288)为中文空格符print(tplt.format("排名", "大学名称", "省市", "总分", ocp = chr(12288)))

python Python

python爬虫入门---第三篇：保存一张图片

590 wiki 2022-01-14

import requestsimport osurl = 'http://imgsrc.baidu.com/forum/w%3D580%3B/sign=749ed018cecec3fd8b3ea77de6b3d63f/83025aafa40f4bfb3661b3800e4f78f0f63618b4.jpg'root_path = r'D:picturezhaoliying'#利用split()函数获取url最后的文件名img_name = url.split('/')[-1]img_path = root_path + r'{0}'.format(img_name)try:#如果根目录不存在就创建该根目录if not os.path.exists(root_path):os.makedirs(root_path)if not os.path.exists(img_path):r = requests.get(url)with open(img_path, 'wb') as f:f.write(r.content)f.close()print("文件保存成功")else:print("文件已存在")except:print("执行出错")-----------------------------------------------------------------输出结果：文件保存成功[Finished in 0.5s]

python Python

python爬虫入门---第一篇：获取某一网站所有超链接

595 wiki 2022-01-14

需要先安装requests库和bs4库import requestsfrom bs4 import BeautifulSoupdef getHTMLText(url):try:#获取服务器的响应内容，并设置最大请求时间为6秒res = requests.get(url, timeout = 6)#判断返回状态码是否为200res.raise_for_status()#设置真正的编码res.encoding = res.apparent_encoding#返回网页HTML代码return res.textexcept:return '产生异常'#目标网页url = 'https://www.cnblogs.com/huwt/'demo = getHTMLText(url)#解析HTML代码soup = BeautifulSoup(demo, 'html.parser')#模糊搜索HTML代码的所有<a>标签a_labels = soup.find_all('a')#获取所有<a>标签中的href对应的值，即超链接for a in a_labels:print(a.get('href'))

python Python

python 与redis

593 wiki 2022-01-14

一、redis安装源码安装：? 1.wget http://download.redis.io/redis-stable.tar.gz? 2.yum install gcc? 3.tar zxvf redis-stable.tar.gz? 4.cd?redis-stable? 5.make&&make install? 6.cp redis.conf /etc/7.配置文件? ?监听地址：bind 0.0.0.0? ?限制最大内存：maxmemory 4294967296（4G）? ?后台运行：daemonize yes8.拷贝并修改系统脚本：? ?cd utils/? cp redis_init_script /etc/init.d/redis?? 修改：? CONF="/etc/redis.conf"? chmod a+x /etc/init.d/redis?ubuntu安装：? $sudo apt-get update? $sudo apt-get install redis-server二、Redis python api

python Python

python – 亚马逊Django每12小时出现[Errno 5]输入/输出错误

474 wiki 2022-01-14

404 Page Not Found!

python Python

使用scipy.stats和statsmodels计算线性回归时的结果不同

593 wiki 2022-01-14

当我尝试OLS适合这两个库时,我得到不同的r ^ 2值(确定系数),我无法弄清楚原因. (为方便起见,删除了一些间距)In [1]: import pandas as pd In [2]: import numpy as np In [3]: import statsmodels.api as sm In [4]: import scipy.s

python Python

python – Django完整性错误_id可能不为null,ForeignKey id赋值

594 wiki 2022-01-14

我在理解Django(v1.6.5)在保存时将id分配给不同对象的方式时遇到了问题.以最小的例子：#models.py class Book(models.Model): title = models.CharField(max_length=10) class Page(models.Model): number = models.Sm

python Python

python – 有没有一种简单的方法来添加边框到Kivy Labels,Buttons,Widgets等没有图像？

588 wiki 2022-01-14

我正在尝试为Kivy Buttons添加边框,但它不能按预期工作.对于标签我的实现似乎没问题,但对于按钮,它会覆盖/清除按钮的标准外观.如何在不改变正常行为的情况下绘制按钮上方的边框？我想像ButtonBehavior一样实现它,所以我可以用画布为每个Kivy对象添加一个边框.我称之为BorderBehavior.样式虚线,虚线仅适用于线宽1,因为Kivy中

python Python

使用dbf Python模块以只读方式打开.DBF文件

665 wiki 2022-01-14

首先,dbf模块很棒.我一直在使用它取得了巨大的成功.我正在尝试在网络共享上打开dbf文件,该共享是一个只读文件系统.当我尝试这样打开它时,我收到一个错误,指出.dbf文件是只读的.thisTable = dbf.Table('/volumes/readOnlyVolume/thisFile.dbf') thisTable.open() 看看文档,看起来有一

python Python

python – Scrapy – 如何根据已删除项目中的链接抓取新页面

642 wiki 2022-01-14

我是Scrapy的新手,我正在尝试从已删除项目中的链接中删除新页面.具体来说,我想从谷歌搜索结果中删除Dropbox上的一些文件共享链接,并将这些链接存储在JSON文件中.获取这些链接后,我想为每个链接打开一个新页面,以验证链接是否有效.如果它有效,我也想将文件名存储到JSON文件中.我使用带有'链接','文件名','状态','err_msg'属性的Drop

python Python

python – 如何将numpy数组作为对象存储在pandas数据框中？

623 wiki 2022-01-14

我有一系列图像,存储在CVS文件中,每个图像一个字符串,该字符串是9216空格分隔整数的列表.我有一个函数将其转换为96x96 numpy数组.我希望将这个numpy数组存储在我的数据帧的一列而不是字符串中.但是,当我从列中检索项目时,它不再可用作numpy数组.数据可以从这里下载,即training.cvs文件的最后一列.https://www.kaggl

python Python

您的鼓励是对我最大的支持