子航个人博客,记录生活点滴

最新博文

互联网+

Mac配置终端梯子模式

5

子航 发布于 2019-02-19

一、确定ss的端口 看 HTTP代理设置 或者 高级设置,确定http(s)和socks的端口 http端口: socks端口: 二、修改终端 用户目录下: 1➜  ~ vim .bash_profile2或者3➜  ~...

阅读(32)评论(0)赞 (1)

互联网+

爬虫敏感图片的识别与过滤,了解一下?

4

子航 发布于 2018-11-02

爬虫敏感图片的识别与过滤,了解一下? 需求 我们需要识别出敏感作者的avatar头像,把”皮卡丘“换成”优雅的python“。 敏感图片样本属性: 爬虫获取的图片属性: 替换成: 原理 检查两个图片的相似度,一个简单而快速的算法:感知哈希算法(Perceptual Hash),通...

阅读(1801)评论(0)赞 (0)

互联网+

调研:爬取微信公众号的方法

子航 发布于 2018-06-18

微信公众号爬虫梳理汇总 一、微信公众号数据源: 1.搜狗微信 :可以获取到 订阅号,近期没有做过变动的公众号。没有服务号,数据分析所需数据不全(点赞/打赏/阅读等等) 2.手机app :数据最全 3.微信公众平台后台历史链接:采集微信公共号历史信息,除了通过中间代理采集APP就是...

阅读(1803)评论(1)赞 (0)

互联网+

python scrapy 爬虫 业务全球化 解决时区问题

子航 发布于 2018-06-10

目标网站位于国外,如何通过爬虫,获取数据,并转出时间戳入库。 首先,为了实现业务全球化,入库时间必须要UTC +0时间。 但是由于在中国本地调试爬虫和爬取数据,网页返回的时间字符串可能是东八区的时间,不是我们需要的UTC 0时间。同时,通过python转时间戳,也是有坑的。 解决...

阅读(1210)评论(0)赞 (0)

互联网+

分享一个关于PM职业规划的ppt,接地气且优秀:《如何规划我的产品经理之路?》

29

子航 发布于 2017-10-07

为利于分享,此份ppt我转为了图片格式并上传新浪图床 划重点:产品经理的主要输出物 划重点:产品经理的日常 划重点:职业特点及其优劣势: 划重点:转行人士可以参考,结合自身优势入行 一点随笔: 1、即使作为开发,也应该有产品思维。 2、无需复杂的专业知识培训,从其他行业跳入互联网...

阅读(1543)评论(0)赞 (3)

互联网+

简易爬虫|使用web scraper 爬取微信公众号后台粉丝属性数据

2

子航 发布于 2017-09-04

待更新: 分析目标:通过爬取粉丝数据,进行粉丝属性分析。由于侯斯特平台给出了粉丝关注时长了互动时间,就可以通过爬虫的方式,获取粉丝数据,从而了解这个公众号粉丝的互动活跃度。 使用到的工具:1.谷歌浏览器web scraper插件 2.侯斯特后台粉丝列表 3.excel 侯斯特后台...

阅读(2067)评论(0)赞 (1)

互联网+

为你的home添加一个微信连wifi,免去告知密码的烦~

1

子航 发布于 2017-09-02

微信连wifi在所有的微信公众号上都可以开通,经过简单的配置(公众号和路由器),打印出一个二维码,就可以体验微信wifi的近场服务了,还可以给自己的公众号吸引粉丝。   2015年业余时间在公司做的连wifi服务: 未经允许不得转载:子航个人博客,记录生活点滴 &raq...

阅读(1009)评论(0)赞 (0)