2021年12月8日
在使用scrapy爬取网页时,由于很多网站采用js渲染的方式,直接诶获取源代码是获取不到需要的网页内容的,此时往往采用selenium驱动浏览器来获取网页内容非常合适。但是有一个问题就是这种情况下需要本地安装浏览器,还非的用非root运行,于是采用docker的方式提供服务chr……
阅读全文
2021年12月6日
由于pip及anaconda的默认地址在国内访问速度感人,添加国内源进行加速十分必要 国内主要开源加速地址 清华大学 https://tuna.tsinghua.edu.cn 阿里云 http://mirrors.aliyun.com 腾讯云 https://mirrors.tencent.com 中国科技大学 https://mirrors.ustc.edu.cn 中国科学技术大学 http://mirrors.ustc.edu.cn 同济大学 http://mirrors.tongji.edu.cn 添加及修改conda源 根据在上海的实际速度看,清华大学的速度最快(同济大学本应该速度最快,然而实际速度感人,……
阅读全文
2020年12月28日
是时候写写各机器学习的内容了。在google等搜索引擎越来越强大和越来越廉价的阿里云等云服务之后,越来越多的人能够有机会实现机器学习和人工智能相关的应用了。任何能够使用笔记本电脑并且乐于学习新知识的人都可以在几分钟内尝试最新的算法。再稍微多花一点时间,您就可以开发实用的模型来帮助……
阅读全文
2020年11月9日
今天来给大家介绍一下python当中能用到的各种字符串的分割方法。他们分别是: slpit rsplit splitlines partition rpartition re.split 下面各部分是各方法的详细介绍 split(sep=None, maxsplit=-1) 最常见的方法,该方法使用sep设置的符号将一个字符串分割并返回分割后的对象,结果为list列表。同时可以通过设置maxsplit参数指定最大分割成的结果列表的……
阅读全文
2020年9月22日
相信很多玩域名的人都在为找寻和抢注合适的域名而四处疯狂刷论坛,网站,为了一个心仪的域名不惜花重金从域名所有者手中购买。由于国际域名管理机构是采取“先申请,先注册,先使用”的方式,而域名只需要缴交金额不高的注册年费,只要持续注册就可以持有域名的使用权。为此,很多域名倒卖(俗称米商)……
阅读全文
2020年9月21日
何为逻辑? 维基百科上的解释: 逻辑(古希腊语:λογική;德语:Logik;法语:logique;英语:logic;意大利语、西班牙语、葡萄牙语: logica),又称理则、论理、推理、推论,是对有效推论的哲学研究[1]。逻辑被使用在大部分的智能活动中,但主要在心理、学习、哲学、语……
阅读全文
2020年7月29日
这是一篇解析编程练习网站LeeCode上面的一道题的文章。 题目地址:力扣 分为几步: 题目内容 官方示例 思路解析和 解题方法 题目内容 验证IP地址 编写一个函数来验证输入的字符串是否是有效的 IPv4 或 IPv6 地址。 IPv4 地址由十进制数和点来表示,每个地址包含4个十进制数,其范围为 0 - 255, 用("……
阅读全文
2020年7月8日
韦恩图在图形可视化方面占据重要地位i,。 在两个集合的韦恩图中,首先,可以有两个(或更多)重叠的圆圈,分别代表不同大小的集合,但是圆圈的大小相同。实际上,圆圈应与集合的大小成比例,重叠区域也应与数据的重叠成比例。这样,在注意到数字之前,您可以立即看到重叠的数字。 这篇文章将详细介绍如……
阅读全文
2020年5月31日
基尼系数和洛伦兹曲线,在表示数据的不平均方面特别是财富的不平均上被广泛应用。但是目前在python里面并没有找到很好的可以直接绘制洛伦兹曲线的函数,由于目前项目用到,也就在实际应用中使用到,就把如何使用numpy,pandas,matplotlib等包来计算基尼系数和绘制洛伦兹曲……
阅读全文
2020年5月31日
贝叶斯理论提供了一种计算条件概率的原则方法。使用它我们可以用来轻松计算平常使用直觉经常失败的事件的条件概率。 贝叶斯理论不仅是概率领域中的强大工具,更是被广泛地应用于机器学习领域。包括将其用于概率模型中将模型拟合到训练数据集(简称为最大后验或MAP),以及开发用于分类预测建模问题(……
阅读全文