https://www./article/22031.htm
个人觉得不甚满意,因为VB.NET在.NET环境下执行采集,产生的网络连接与正则匹配消耗太大,而我最终的应用是在视频采集提交上,所以就考虑用JS的AJAX+正则表达式来完成这个目标。
以前一直没有系统地学习JS和正则,所以花费的时间比预想的要长,折腾了一个晚上,糊弄出了下面的代码。=..=
代码
复制代码 代码如下:
<!--
夜闻香原创,转载请保留此信息,万分感谢!
博客: http://clso.cnblogs.com
主页: http://cleclso.cn
QQ:315514678 E-mail:clso#qq.com
欢迎技术交流!
-->
<html>
<head>
<title>JavaScipt AJAX & 正则表达式 test</title>
<script type="text/javascript" language="javascript">
function wrt(s){
subret.value = s + "\n" + subret.value;
//subret.value += "\n" + s;
}
var objRequest; //定义一个XML请求对象
var previd = "",nowid =0,listid = "",iscancel=false; //其他变量
function getlid(){
var listid = weburl.value.match(/playlist_show\/.*(?=id_(\d+)).*\.html$/i);
if(!listid){
return null;
} else {
return listid[1];
}
}
function retweb(){
if(objRequest.readyState == 4 && objRequest.status == 200){
// 获得回调
var webstr = objRequest.responseText;
vid = webstr.match(/var\s+videoId\s*=\s*"(\d+)"\s*;/)[1];
vtitle = webstr.match(/<title>(.+) - (.+) - 视频 - 优酷视频 - 在线观看( - )?<\/title>/)[2];
wrt(nowid + ":" + vtitle + "=" + vid);
if(previd == vid) return;
previd = vid;
nowid += 1;
// 开始新循环
if(iscancel) return;
tstart();
} else {
//alert("回调失败!");
return;//"error: " + objRequest.statusText;
}
}
function getweb(u){
objRequest = new XMLHttpRequest(); //new ActiveXObject("Msxml2.XMLHTTP"); //IE5&6初始化XMLHTTP对象
objRequest.onreadystatechange = retweb; //异步回调方法
objRequest.open("GET",u,true);
objRequest.send(null);
}
function tstart(){
if(listid==""){
listid=getlid();
}
url = "http://v.youku.com/v_playlist/f" + listid + "o1p" + nowid + ".html";
getweb(url);
}
</script>
</head>
<body>
<input type="text" id="weburl" value="http://www.youku.com/playlist_show/id_2350764.html" style="width:640" /><br />
<textarea id="subret" readonly="readonly" style="width:640; height:360;">#star</textarea>
<br/>
<input type=button value="开始提取专辑" onclick="if(iscancel)iscancel=false;tstart();" />
<input type=button value="清除文本" onclick="subret.value='';nowid =0;preid='';listid='';" />
<input type=button value="暂停" onclick="iscancel=true;" />
</body>
</html>
思路基本跟上次的一样,所以就不多赘述了。
用VB.NET一个页面的采集时间一般在1秒钟左右,而这个代码依靠客户端脚本,每个页面采集在0.3~0.5秒左右,依据用户的电脑配置而不同。
个人用IE7测试通过,但代码比较随意,所以兼容性不是很好。如果你需要使用,请自行修改代码。
相关推荐:
seo都有什么问题,seo都有什么问题和答案 ,ai凯旋公主下载
AI网页生成:轻松构建智能网站,提升品牌竞争力,杭州专业ai智能教育
SEO与SEM策略:提升网站流量与品牌曝光的双剑合璧,ai补图
SEO就业前景如何?打造数字时代的职业新风口,常州武进区水产网站建设
文章写作AI:让创作更高效、精准的智能助手
SEO怎么优化比较好?全面提升网站排名的实用技巧,高级ai玩家
seo软件是什么职位,seo用的是什么软件 ,ai感知树
seo黑帽是什么,列举几种seo黑帽行为 ,穿老款的ai丢人吗
Chatget免费网站版无需登录,畅享无限对话体验!,工业 Ai 视觉检测
AI写作免费一键生成下载,助您轻松创作!
AI免费文章生成器:轻松创作高质量内容的终极工具
seo要会些什么,seo需要学些什么内容 ,轻盈ai
ChatGPT当前不可用?如何应对AI服务中断的挑战,ai文章免费写作app
ChatGPT不能用?揭秘你可能忽视的真相和解决方法,强国ai2022
ChatGPT,您的银行卡被拒绝了?别慌,这些方法帮您快速解决问题!,ai给那个标声调
高效创作之路:文章AI生成器的力量
ChatGPT付款银行卡被拒绝?解决方案全解析!,小发猫ai智能写作查重能过吗
打破创作边界,无限可能无限制生成文章的AI
SEO表格:优化网站排名的秘密武器,大数据推广营销费用多少
SEO提高:如何通过精准优化让网站流量翻倍,优化排名seo加盟费用
SEO站群:打造强大网络营销引擎,助力企业快速提升排名与流量,seo网站排名案例
OpenAI注册问题解决方案:如何顺利通过手机号验证,反对ai头像
ChatGPT网页版为什么不能用了?解析原因与解决办法,女人莫名其妙想ai
ChatGPT出现错误503?你需要知道的解决方案和应对策略,ai拉伸字效
为什么“未备案域名”会成为互联网行业中的重要问题?,江干区seo优化价格
“爱站”:开启网站优化与流量增长的新纪元,seo入门ppt
SEO表述:如何通过精准优化让你的内容脱颖而出,江阴网站建设怎么样啊
seo要懂些什么,seo主要做什么的 ,小艾艾AI
SEO快排还有效果吗揭秘快速排名的真相与未来趋势,ai人像波普
主题导航-引领互联网世界的智慧之路,大渡口网站建设方案
文章续写AI:提升写作效率,创意无限
ChatGPT破解:人工智能未来的无限可能,污污AI解说
GPT在智能聊天机器人中的作用:重塑沟通体验,开创智能未来,百万级ai
AI一键生成文章免费版:颠覆写作新体验
SEO地址优化的秘诀:提升网站排名与流量的关键,临沂如何优化网站关键词
SEO韩国:为您开启国际市场的增长之门,seo文章标题有哪些
seo能解决什么问题,seo会遇到哪些问题 ,挚爱花嫁ai
SEO软优化:助力网站实现流量爆发的秘密武器,延平区网页seo
seo读什么书,seo是哪个专业的 ,亚洲9ai吧
什么是seo网站推广,什么是seo网站推广 ,ai酷男人
SEO主要是为网站引流吗?深入解析SEO的核心价值,AI算算
专业SEO助力企业在激烈市场竞争中脱颖而出,嘉兴海外网站推广价格
Chatttst:开启智能沟通新时代的无限可能,上海联通ai
SEO教育:搜索引擎优化,开启成功职业之路,搜狗SEO排名接单
SEO爱站:提升网站排名,赢得流量的秘密武器,优化网站设计价格多少
SEO门户:打造高效网站流量的关键利器,创意网站建设要求
URL泄露:如何防止信息泄露带来的严重后果,抖音推广营销服务多少钱
seo规范是什么,seo行业标准 ,啊龙ai音乐
SEO技巧提升网站流量和排名,助力企业快速崛起,ai080206.
SEO能给企业带来什么价值,seo的影响 ,ai蓝衣美女