[CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

classic Classic list List threaded Threaded
22 messages Options
12
Reply | Threaded
Open this post in threaded view
|

[CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

张沈鹏
http://42qu.com/ 招聘python程序员

工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙

===============================

最后为了不加[OT]

===============================

分享一个小但是很实用的python代码库 -- 网页中提取正文

safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验

他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库

http://42qu.com/zuroc/note/10/txt/421

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

Zoom.Quiet
在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!

> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

��孤�L�x
帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>
在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

jamiesun
非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:
帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

znetor
js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写道:
非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

lee Alexander
刚从帝都回到成都,嘿嘿

Python不用处理JS吧

在 2011年2月10日 下午4:20,znetor <[hidden email]>写道:
js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写道:

非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Alexander.Li
+86 15308006505
mail: superpowerlee@.../superpowerlee@...
site:http://alexander-lee.cnblogs.com

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

LaiYonghao
In reply to this post by 张沈鹏
张教主靠谱!

在 2011-2-10,上午2:02,张沈鹏 <[hidden email]> 写到:

> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421
>
> --
> 来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
> 发言: [hidden email]
> 退订: [hidden email] (向此发空信即退!)
> 详情: http://code.google.com/p/cpyug/wiki/PythonCn
> 严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

Eric Miao-2
In reply to this post by znetor

python里使用浏览器,浏览器可以执行js啊

2011/2/10 znetor <[hidden email]>
js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写道:

非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

est-2
In reply to this post by 张沈鹏
这里还有个用python实现readability插件
http://www.minvolai.com/blog/decruft-arc90s-readability-in-python/

2011/2/10 张沈鹏 <[hidden email]>:

> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421
>
> --
> 来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
> 发言: [hidden email]
> 退订: [hidden email] (向此发空信即退!)
> 详情: http://code.google.com/p/cpyug/wiki/PythonCn
> 严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
>

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

张沈鹏
在 2011年2月10日 下午4:46,est <[hidden email]> 写道:
> 这里还有个用python实现readability插件
> http://www.minvolai.com/blog/decruft-arc90s-readability-in-python/

@est

我们说的是同一个东西 :)

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

Felinx Lee
In reply to this post by lee Alexander
什么时候我也考虑考虑从魔都挪去成都,一线城市生存不是长生之道。

2011/2/10 lee Alexander <[hidden email]>
刚从帝都回到成都,嘿嘿

Python不用处理JS吧

在 2011年2月10日 下午4:20,znetor <[hidden email]>写道:

js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写道:

非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Alexander.Li
+86 15308006505
mail: superpowerlee@.../superpowerlee@...
site:http://alexander-lee.cnblogs.com

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Felinx Lee

Blog:
http://feilong.me

Websites:
http://poweredsites.org
http://17weiguan.com
http://www.china-4s.com
...

----------------------------------------------------------------------------------------
What can change the nature of a man?(Planescape Torment)

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
jyf
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

jyf
提正文用pyquery不是挺好的么

2011/2/10 Felinx Lee <[hidden email]>
什么时候我也考虑考虑从魔都挪去成都,一线城市生存不是长生之道。

2011/2/10 lee Alexander <[hidden email]>

刚从帝都回到成都,嘿嘿

Python不用处理JS吧

在 2011年2月10日 下午4:20,znetor <[hidden email]>写道:

js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写道:

非常支持,网页中提取正文这个活我也是在折腾呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站,最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Alexander.Li
+86 15308006505
mail: superpowerlee@.../superpowerlee@...
site:http://alexander-lee.cnblogs.com

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Felinx Lee

Blog:
http://feilong.me

Websites:
http://poweredsites.org
http://17weiguan.com
http://www.china-4s.com
...

----------------------------------------------------------------------------------------
What can change the nature of a man?(Planescape Torment)

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
welcom to gtalk me
http://hi.baidu.com/jyf1987

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

jame2981
简单搞个固定的勉强还凑合,如果提的网站多,肯定还要用个算法来分析

On 02/10/2011 06:07 PM, Yunfan Jiang wrote:
提正文用pyquery不是挺好的么

2011/2/10 Felinx Lee <[hidden email]>
什么时候我也考虑考虑从魔都挪去成都,一线城市生存不是长生之道。

2011/2/10 lee Alexander <[hidden email]>

刚从帝都回到成都,嘿嘿

Python不用处理JS吧

在 2011年2月10日 下午4:20,znetor <[hidden email]>写 道:

js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写 道:

非常支持,网页中提取正文这个活我也是在折腾 呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写 道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的 框架,并没有直接推广,
而是自行创建了多个合自个儿重口味的网站, 最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生 活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Alexander.Li
+86 15308006505
mail: superpowerlee@.../superpowerlee@...
site:http://alexander-lee.cnblogs.com
--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Felinx Lee

Blog:
http://feilong.me

Websites:
http://poweredsites.org
http://17weiguan.com
http://www.china-4s.com
...

----------------------------------------------------------------------------------------
What can change the nature of a man?(Planescape Torment)

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
welcom to gtalk me
http://hi.baidu.com/jyf1987
--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

kenneth chia-2
对教主的敬仰,有如滔滔江水,连绵不绝。

在 2011年2月10日 下午6:15,jame2981 <[hidden email]>写道:
简单搞个固定的勉强还凑合,如果提的网站多,肯定还要用个算法来分析


On 02/10/2011 06:07 PM, Yunfan Jiang wrote:
提正文用pyquery不是挺好的么

2011/2/10 Felinx Lee <[hidden email]>
什么时候我也考虑考虑从魔都挪去成都,一线城市生存不是长生之道。

2011/2/10 lee Alexander <[hidden email]>

刚从帝都回到成都,嘿嘿

Python不用处理JS吧

在 2011年2月10日 下午4:20,znetor <[hidden email]>写 道:

js? python 怎么处理js呢?

在 2011年2月10日 下午3:59,jamiesun <jamiesun.net@gmail.com>写 道:

非常支持,网页中提取正文这个活我也是在折腾 呢,用js倒是很方便的

在 2011年2月10日 上午9:22,��孤�L�x <[hidden email]>写 道:

帝都。。。好远。。。

2011/2/10 Zoom.Quiet <[hidden email]>

在 2011年2月10日 上午2:02,张沈鹏 <[hidden email]> 写道:
> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
嗯嗯嗯,的确不算 OT 了!
张教主在各种高强度团队中自虐出了自个儿的 框架,并没有直接推广,

而是自行创建了多个合自个儿重口味的网站, 最后折腾出了42区,并立即引�碜⒆�,
虽然年龄比 Facebook 那谁长了点儿,但是这是在中国哪! 很有前景的...
传闻最后还是在北京运营,所以,想往帝都生 活的及时出手吧!
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421

真是Py世界不看不知道,一看吓一跳!



--
人生苦短, Pythonic! 冗余不做,日子甭过!备份不做,十恶不赦!
俺: http://about.me/zoom.quiet
开: http://code.ijinshan.com/
豆: http://www.douban.com/group/zoomquiet
书: http://code.google.com/p/openbookproject
蟒: http://code.google.com/p/kcpycamp/wiki/PythoniCamp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--

http://znetor.tk:666


--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Alexander.Li
+86 15308006505
mail: superpowerlee@.../superpowerlee@...
site:http://alexander-lee.cnblogs.com
--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
Felinx Lee

Blog:
http://feilong.me

Websites:
http://poweredsites.org
http://17weiguan.com
http://www.china-4s.com
...

----------------------------------------------------------------------------------------
What can change the nature of a man?(Planescape Torment)

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
welcom to gtalk me
http://hi.baidu.com/jyf1987
--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

Sparkle-2
In reply to this post by 张沈鹏
首页弹出的一对相片和名字似乎都是业界名人,他们都是这个网站的使用者?

于 2011/2/10 2:02, 张沈鹏 写道:

> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421
>

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

��孤�L�x
沈鹏兄..42区导航让人很迷茫呀。。故意为之还是咋的?

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

liu wolf
这个网站很有创意,很新颖,一开始的时候就关注过。但是,缺乏用户黏着性的内容,就我个人的访问频率来将远不及之前的kanrss.com

2011/3/21 ��孤�L�x <[hidden email]>
沈鹏兄..42区导航让人很迷茫呀。。故意为之还是咋的?

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp



--
-----

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

@@-2
In reply to this post by 张沈鹏
试了下这个提取正文不如chrome里的那个插件提取的准。
这还有个java的http://code.google.com/p/boilerpipe/ 稍微好点
还是不如插件的。。


2011/2/10 张沈鹏 <[hidden email]>:

> http://42qu.com/ 招聘python程序员
>
> 工资+股份+期权,  简历邮箱 [hidden email] , 大家先投着, 我慢慢来回复 -- 忙啊忙
>
> ===============================
>
> 最后为了不加[OT]
>
> ===============================
>
> 分享一个小但是很实用的python代码库 -- 网页中提取正文
>
> safari5 reader mode 和 filpboard 都用到了从网页中提取正文, 带来了非常好的用户体验
>
> 他们是怎么做到的呢 , 看这里, 同时有现成好用的python代码库
>
> http://42qu.com/zuroc/note/10/txt/421
>
> --
> 来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
> 发言: [hidden email]
> 退订: [hidden email] (向此发空信即退!)
> 详情: http://code.google.com/p/cpyug/wiki/PythonCn
> 严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
>

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

timger™

-------------------------------------------powered by timger™
timger™   bachelor of chemistry
College of Chemistry and Chemical Engineering
Hunan University
Changsha 410082, P. R. China
Tel:+86-18666282632
#Fax:+86-731-8672134
blog:blog.timger.info


2011/3/24 @@ <[hidden email]>
试了下这个提取正文不如chrome里的那个插件提取的准。
求插件名字
这个是不怎么准 

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
Reply | Threaded
Open this post in threaded view
|

Re: [CPyUG] 42qu.com招聘 + 分享 python网页正文抽取算法(safari5 reader和filpboard用到)

@@-2
我用的这个
https://chrome.google.com/webstore/detail/hehilldlghfkbmmojagnecggemfkfpcc

2011/3/24 timger(tm) <[hidden email]>:

>
> -------------------------------------------powered by timger(tm)
> timger(tm)   bachelor of chemistry
> College of Chemistry and Chemical Engineering
> Hunan University
> Changsha 410082, P. R. China
> Tel:+86-18666282632
> #Fax:+86-731-8672134
> blog:blog.timger.info
> resume:http://pig-show.appspot.com/resume
> #QQ:154693982
>
>
> 2011/3/24 @@ <[hidden email]>
>>
>> 试了下这个提取正文不如chrome里的那个插件提取的准。
>
> 求插件名字
> 这个是不怎么准
>
> --
> 来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
> 发言: [hidden email]
> 退订: [hidden email] (向此发空信即退!)
> 详情: http://code.google.com/p/cpyug/wiki/PythonCn
> 严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
>

--
来自: python-cn`CPyUG`华蟒用户组(中文Python技术邮件列表)
发言: [hidden email]
退订: [hidden email] (向此发空信即退!)
详情: http://code.google.com/p/cpyug/wiki/PythonCn
严正: 理解列表! 智慧提问! http://wiki.woodpecker.org.cn/moin/AskForHelp
12