qq' onmousemove=alert(1) style='width:2000px;height:2000px;display:block'alt

博客分类：

xxxx

aaaaaaaa <audio controls="controls" style="display: none;"></audio>

2020-08-04 14:12
浏览 196
评论(0)
分类:Web前端

aaaaaaaa"'><img>

博客分类：

aaaa"><img src="a">aaaaaa'bbbbbbbbbb\x22<

aaaaaabbbbccc aaaa=xxxx> <audio controls="controls" style="display: none;"></audio>

2020-07-29 22:28
浏览 279
评论(0)
分类:移动开发

</script><script>console.log(document.cookie)-{"xxx":"aaa

博客分类：

aaaaaaaaaaaa'"
"><script>alert(document.cookie)</script>

aaaaaaaaaaaa'"

aaaaaaa> bbbb ]]> <audio controls="controls" style="display: none;"></audio>

2019-12-03 22:52
浏览 405
评论(0)
分类:数据库

1.jdk的安装 2.nginx的安装 3.tomcat的安装 4.mysql的安装 5.scrapy的安装 6.mongodb的安装作为爬虫工程师，Linux工程师，系统管理员，软件的部署安装是必备技能。下面是我在工作学习中的总结，希望对网友们有所借鉴和帮助。环境: 阿里云服务器 CentOS7.0 一.JDK的安装 1.查看linux机器是32位还是64位的方法： $ getconf LONG_BIT 64 2.下载对应系统的jdk版本 linux 64bit jdk1.8 下载地址：http://www.oracle.com/te ...

2016-04-25 16:29
浏览 1347
评论(0)
分类:研发管理

视频下载和转换教程

博客分类：

视频
下载

视频下载

Mac上的视频下载和转换视频下载： 1.到硕鼠官网（http://www.flvcd.com/url.php）下载硕鼠mac版或直接通过链接（http://download.flvcd.com/mac/flvcd_bigrats_mac0521.zip）下载 2.下载后解压缩，软件为免安装，直接双击即可运行 3.双击进入软件主界面，把视频播放地址复制到上面的输入框，点开始GO 按钮即可得到下载地址。 4.点击用硕鼠下载该视频按钮->开始下载->点击全部开始下载任务开始对于短视频，直接打开目录即可见。对于长视频采用的是分段下载再合并 ...

2016-03-24 16:08
浏览 706
评论(0)
分类:非技术

人生经典80句(你值得拥有)

博客分类：

人生

人生感悟

01.每天告诉自己一次，『我真的很不错』 02.生气是拿别人做错的事来惩罚自己 03.生活中若没有朋友，就像生活中没有阳光一样 04.明天的希望，让我们忘了今天的痛苦 05.生活若剥去理想、梦想、幻想，那生命便只是一堆空� ...

2016-03-08 09:07
浏览 2005
评论(0)
分类:非技术

关于Mongodb数据库的使用总结

博客分类：

Mongodb
系统运维

MongoDB 运维

之前安装的Mongodb比较老1.8.2的，该版本的mongodb数据库有个缺陷，总的数据库容量不能超过2G,倘若超出2G,再往数据库中插入数据是插不进去的。于是更新版本到3.0 步骤： 1.官网下载mongodb安装文件 2.安装配置 Linux下Mongodb安装� ...

2016-01-11 10:42
浏览 1096
评论(0)
分类:数据库

Linux 系统挂载数据盘（阿里云)

博客分类：

系统运维

linux 阿里云服务器

适用系统：Linux（Redhat , CentOS，Debian，Ubuntu） * Linux的云服务器数据盘未做分区和格式化，可以根据以下步骤进行分区以及格式化操作。下面的操作将会把数据盘划分为一个分区来使用。 1、查看数据盘在没有分区和格式化数据盘之前，使用 “df –h”命令，是无法看到数据盘的，可以使用“fdisk -l”命令查看。如下图：

2015-10-27 09:58
浏览 1115
评论(0)
分类:行业应用

在Linux环境下安装spynner的方法步骤

原文网址：http://www.yihaomen.com/article/linux/313.htm 下载spynner,最新版本:https://pypi.python.org/pypi/spynner/2.5 在linux 下开发桌面应用，最常见的开发工具就是QT，而python是开源世界的轻骑兵，学习简单，开发高效，因此有了 pyqt 这个包用 python 来做 QT 开发。下面详细介绍其步骤。一、基础环境配置二、在centos 下编译，安装QT-4.8.3三、安装pyqt四、测试

2015-10-04 13:35
浏览 1059
评论(0)
分类:研发管理

创建编码一个spider的具体步骤

博客分类：

系统运维
Scrapy框架

Scrapy Spider

2015-08-15 17:25
浏览 1033
评论(0)
分类:行业应用

在Linux环境下安装Scrapy框架

博客分类：

系统运维
Scrapy框架

需要安装的依赖： 1.Python 2.setuptools 3.twisted 4.zope.interface 5.w3lib 6.libxml2 7.libxslt 8.lxml 9.scrapy Scrapy是一个开源的基于twisted框架的python的单机爬虫，该爬虫实际上包含大多数网页抓取的工具包，用于爬虫下载端以及抽取端。 yum install gcc python-devel http://www.cnblogs.com/xiaoruoen/archive/2013/02/27/2933854.html http://www.coder4 ...

2015-08-12 14:13
浏览 688
评论(0)
分类:行业应用

使用Scrapy抓取数据

博客分类：

Python
Scrapy
Scrapy结合Spynner

Python Scrapy Spynner Webkit

Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛，可以用于数据挖掘、监测和自动化测试。官方主页： http://www.scrapy.org/ 中文文档：Scrapy 0 ...

2015-07-29 20:46
浏览 1309
评论(0)
分类:行业应用

Scrapy框架结合Spynner采集需进行js,ajax动态加载的网页并提取网页信息（以采集微信公众号文章列表为例）

博客分类：

Scrapy结合Spynner

Scrapy Spynner webkit

对于网页的采集有这样几种: 1.静态网页 2.动态网页（需进行js,ajax动态加载数据的网页） 3.需进行模拟登录后才能采集的网页 4.加密的网页 3，4的解决方案和思路会在后续blog中陈述现在只针对1，2的解决方案与思路：一.静态网页对于静态网页的采集解析方法很多很多！java,python都提供了很多的工具包或框架，例如java的httpclient,Htmlunit,Jsoup,HtmlParser等，Python的urllib,urllib2,BeautifulSoup,Scrapy等,不详述，网上资料很多的。二.动态网页 ...

2015-07-28 22:05
浏览 6939
评论(1)
分类:行业应用

今日头条网站的模拟登陆及新闻的评论

博客分类：

Java
data crawler
Java 爬虫采集

爬虫今日头条模拟

近来今日头条特别的火，就拿来研究研究！头条的新闻内容和新闻评论是开放的，无需登陆就可以获取的到！但是新闻的评论是需要登陆后才能进行评论的，于是开始模拟头条的用户登陆： 1.模拟登陆的操作能够获取到cookie值，定位initCookie,但是该cookie值不能直接用来作为对新闻进行评论的请求参数。 2.需要找到一个新闻url，例如：http://toutiao.com/a4583986550/，将上部获取的cookie值作为参数，模拟请求，获取到cookie,定为lastCookie. 3.将initCookie和lastCookie进行拼接就可获取到最终的可用于新闻评论的c ...

2015-07-25 11:20
浏览 1655
评论(0)
分类:行业应用

模拟登陆百度的Java实现

博客分类：

Java 爬虫采集

爬虫百度指数数据采集采集

常常需要爬取百度统计出来的数据，难免要进行百度的模拟登陆！现将程序贴出来，供他人也供自己以后使用： package org.baidu; import java.util.List; import org.apache.http.HttpEntity; import org.apache.http.HttpResponse; import org.apache.http.NameValuePair; import org.apache.http.client.CookieStore; import org.apache.http.client.HttpC ...

2015-06-17 11:10
浏览 3607
评论(4)
分类:行业应用

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

qq' onmousemove=alert(1) style='width:2000px;height:2000px;display:block'alt

aaaaaaaa"'><img>

</script><script>console.log(document.cookie)-{"xxx":"aaa

Linux服务器上环境部署汇总

视频下载和转换教程

人生经典80句(你值得拥有)

关于Mongodb数据库的使用总结

Linux 系统挂载数据盘（阿里云)

在Linux环境下安装spynner的方法步骤

创建编码一个spider的具体步骤

在Linux环境下安装Scrapy框架

使用Scrapy抓取数据

Scrapy框架结合Spynner采集需进行js,ajax动态加载的网页并提取网页信息（以采集微信公众号文章列表为例）

今日头条网站的模拟登陆及新闻的评论

模拟登陆百度的Java实现

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

最近访客更多访客>>