欢迎光临
我们一直在努力

admin的文章

世界这么大,Python 也想去看看-IT技术资讯
Python

世界这么大,Python 也想去看看

admin阅读(1194)评论(0)赞(0)

  把时间线拉回到 2015 年 4 月 13 日,一位河南省实验中学的心里老师在辞职信上写下了「世界那么大,我想去看看」这句话,后来爆红网络,我想这位心里老师当时写这句话的时候肯定没想到这句只有十个字的话,成为了当年的网络经典语...

Python 爬取“微博树洞”详细教程-IT技术资讯
Python

Python 爬取“微博树洞”详细教程

admin阅读(1157)评论(0)赞(2)

最近要做一个关于自动从微博等短文本数据中判断人是否有自杀倾向的项目,在这之前需要先收集许多具有自杀倾向的人发的微博或短文本数据作为训练集。 其实这样的数据是挺难找的,尤其是对于我这种需求量比较大的项目。不过好在最后发现了突破口:“微博树洞”...

Python 的缩进是不是反人类的设计?-IT技术资讯
Python

Python 的缩进是不是反人类的设计?

admin阅读(1037)评论(0)赞(1)

前些天,我写了《Python为什么使用缩进来划分代码块?》,文中详细梳理了 Python 采用缩进语法的 8 大原因。我极其喜欢这种简洁优雅的风格,所以对它赞美有加。 然而文章发出去后,非常意外,竟收到了大量的反对意见!!(以往文章的互动不...

Python 超简单爬取新浪微博数据 (高级版)-IT技术资讯
Python

Python 超简单爬取新浪微博数据 (高级版)

admin阅读(1338)评论(0)赞(1)

新浪微博的数据可是非常有价值的,你可以拿来数据分析、拿来做网站、甚至是*****。不过很多人由于技术限制,想要使用的时候只能使用复制粘贴这样的笨方法。没关系,现在就教大家如何批量爬取微博的数据,大大加快数据迁移速度! 我们使用到的是第三方作...

为什么你会被限制登录网页版微信?-IT技术资讯
Python

为什么你会被限制登录网页版微信?

admin阅读(1443)评论(0)赞(2)

有一个词叫做“三月爬虫”,指的是有些学生临到毕业了,需要收集数据写毕业论文,于是在网上随便找了几篇教程,学了点requests甚至是urllib和正则表达式的皮毛,就开始写爬虫疯狂从网上爬数据。这些爬虫几乎没有做任何隐藏自己的举动,不换IP...

分享一个零基础快速爬取数据的工具-IT技术资讯
Python

分享一个零基础快速爬取数据的工具

admin阅读(1186)评论(0)赞(1)

今天介绍下如何使用pyppeteer抓取网页的数据。pyppeteer是web应用自动化测试的具,可以直接运行在浏览器中,通过代码控制与页面上元素进行交互,并获取对应的信息。 以前我们我们爬取数据都是通过写代码爬取,当待爬取的网站需要登录时...

Python

解决 Django 多进程下,logging 记录日志错乱问题

admin阅读(1282)评论(0)赞(1)

之前写过一篇文章 Django 中如何优雅的记录日志,本以为代码上线之后,就可以愉快的看日志,通过日志来分析问题了,但现实总是跟想象不同,两个异常现象纷纷挥起大手,啪啪地打在我的脸上。 两个异常如下: 日志写入错乱; 日志并没有按天分割,而...

Python

10行代码入门机器学习

admin阅读(1114)评论(0)赞(1)

最近在哔哩哔哩刷到一位up主,仅用了10行代码就实现了机器学习,真让我叹为观止。看视频戳这里 以下是我的学习总结。 开始 小强会去看电影吗? 如花,小倩,小明和小强,他们是好基友,经常相约去看电影。但小强不是每次都去,以下是他们前四次相约去...

Python

17. Go 语言中的 make 和 new 有什么区别?

admin阅读(1148)评论(0)赞(3)

Hi,大家好,我是明哥。 在自己学习 Golang 的这段时间里,我写了详细的学习笔记放在我的个人微信公众号 《Go编程时光》,对于 Go 语言,我也算是个初学者,因此写的东西应该会比较适合刚接触的同学,如果你也是刚学习 Go 语言,不防关...

十分钟定位用户价值 - Python RFM数据挖掘-IT技术资讯
Python

十分钟定位用户价值 - Python RFM数据挖掘

admin阅读(1187)评论(0)赞(1)

前言 Python由于丰富而强大的类库,广泛应用与互联网各技术领域,其中以数据挖掘和分析最为常见,本文通过Python实现RFM用户价值分析模型,带大家一起感受数据挖掘与分析的乐趣~ RFM:消费(Recency)、消费频率(Frequen...

【老板叫我了】选java?还是选python?-IT技术资讯
Python

【老板叫我了】选java?还是选python?

admin阅读(1136)评论(0)赞(1)

  前言 这个系列是用来记录学习数据分析的过程 以前看技术文的时候看到1234觉得很枯燥 有时候通篇啃下来脑海只有一个大概印象,复述的时候总说不出来 所以我喜欢用“问–答”的形式记录知识点,每一个提问都能加深对知识点的...

golang

Go语言使用TCP_NODELAY控制发包流量

admin阅读(1292)评论(0)赞(1)

编写健壮且高性能的网络服务需要付出大量的努力。提高服务性能的方式有很多种,比如优化应用层的代码,更进一步,还可以看看垃圾回收器,操作系统,网络传输,以及部署我们服务的硬件是否有优化空间。 TCP/IP协议栈中的一些算法会影响到服务性能。本文...

Redis 6.0 的客户端缓存-IT技术资讯
Redis

Redis 6.0 的客户端缓存

admin阅读(1229)评论(0)赞(2)

近日 Redis 6.0.0 GA 版本发布,这是 Redis 历史上最大的一次版本更新,包括了客户端缓存 (Client side caching)、ACL、Threaded I/O 和 Redis Cluster Proxy 等诸多更新...

Redis 6.0 客户端缓存特性及实践-IT技术资讯
Redis

Redis 6.0 客户端缓存特性及实践

admin阅读(1103)评论(0)赞(0)

@antirez 提到只是Redis历史上最大的一次版本更新,所以谨慎建议在应用的产品中还是多多测试评估,并且承诺一旦遇到大的bug就会紧急发布6.0.1版。果不其然,一天后就发布了 6.0.1版,修复了一个allocator的bug,这个...

golang

Golang sql.DB 优化配置

admin阅读(1703)评论(0)赞(1)

原文: Configuring sql.DB for Better Performance 网上有很多教程介绍 sql.DB , 以及如何使用它来执行SQL数据库查询和语句, 但是大部分都没有介绍 SetMaxOpenConns() 、 S...

进程管理工具 Supervisor-IT技术资讯
Linux

进程管理工具 Supervisor

admin阅读(1078)评论(0)赞(0)

  要想在终端后台常驻进程,首先想到的是在命令后加 & 符号,来达到隐藏程序在后台的目的,尽管看起来进程已经在后台运行了,实际上终端会话关闭时进程还是会被 kill 掉,这种问题一般是采用搭配 nohup 命令来解决的,n...