
获取网页正文,提取网页正文,用aardio翻译的php类库来实现的
只能说这代码不怎样,还不如以前我C#自己研究的准确。。基本上只有对百度知道这样,内容超少的才会误抓。 基本上大新闻站,或普通博客类的,95% 以上准确。。。。 而今天翻译的这个。。。。吐血了。。。。 上代码吧。 //提取网页正文 import inet; import inet....
阅读(3687)评论(0)
只能说这代码不怎样,还不如以前我C#自己研究的准确。。基本上只有对百度知道这样,内容超少的才会误抓。 基本上大新闻站,或普通博客类的,95% 以上准确。。。。 而今天翻译的这个。。。。吐血了。。。。 上代码吧。 //提取网页正文 import inet; import inet....