文章管理
2016-07-14 11:01:25 0 举报
AI智能生成
文章管理是指对文章进行编辑、发布、分类、归档等一系列操作的过程。它包括了对文章内容的审核、修改、排版等,以及对文章标题、摘要、关键词等信息的设置。文章管理可以帮助网站管理员更好地控制网站内容,提高用户体验。此外,文章管理还可以通过数据分析来了解用户喜好,为网站运营提供参考。总之,文章管理是网站运营中不可或缺的一环,它为网站提供了丰富、高质量的内容,有助于提升网站的知名度和影响力。
作者其他创作
大纲/内容
文章管理
文章操作
修改文章
文章封面图-从原文自动获取
图片质量提取技术
文章原作者-抓取
文章名称-抓取
文章来源-抓取
发布时间-抓取
原文地址-抓取
正文-抓取/转码服务
关联商品-录入
商品模糊搜索
上架
前端可访问页面
推送到搜索队列
debug
保留一份抓取的原始数据,未转码之前
该文章关联的商品所属分类,品牌-词条管理
文章抓取
一喵自动
流程
提取body中的所需标签
过滤正文
添加商品名称
维护网站/模板
通过文章找商品
二喵人工
流程
抓取页面,提取标签
正文过滤
添加商品名称
维护网站/模板
通过商品找文章
文章摘要
目标:按照文章的字数和段落取摘要
方案和思路
1.文章过滤无效信息
物流信息,含申通,顺丰等关键词,将含有该关键词的<p>去掉
参数信息,含有的<p>去掉
其他无效信息,如公众号,广告,转载等段落
2.过滤后文章字数<10,取文章标题为摘要
3.过滤后文章字数>10
1.先选取30-100之间的<p>.符合的p按照关键词(文章的商品名)的的频次排序,当第一个p不足40字,第二个p补上.
2.无1的,取>100的p,按照关键词出现频次取最高的p
3.当没有满足1和2的p,将文章所有的p连接起来,取结果
文章转码
转码内容
视频转码
目标:可在各个端播放
支持格式
网站来源
优酷
http://v.youku.com/v_show/id_XMTU1NjA1NzU0OA==.html
http://v.youku.com/v_show/id_XMTU1MDgwMzE4MA==.html?f=27152641
http://v.youku.com/v_show/id_XOTI2OTExMDY0.html
土豆
http://www.tudou.com/programs/view/2o-0666RUjE
http://www.tudou.com/listplay/1vKtz3kvgYQ/1iDFTxJOLZk.html
腾讯
http://v.qq.com/cover/f/f1te53zkn7y146s.html?vid=x00203sequg
http://film.qq.com/cover/l/lqu72d3jbm1zlzg.html?vid=d0196xuuf3n
http://v.qq.com/page/l/r/r/l001365yurr.html (11位)
http://static.video.qq.com/TPout.swf?vid=u0020dxaa6a&auto=0 (flash格式)
转码返回参数
code:1:转码成功,0:转码失败
content_tran:转码后内容
使用url中参数,如XMTU1NjA1NzU0OA,放到标签壳子中,可在网页播放
转码效果转成通用格式,不存储
通用格式:<iframe>
html格式:<embed>,也是flash格式
flash格式:含有swf
<iframe src="http://player.youku.com/embed/XMTYwNjU1MTMwOA" frameborder="0" allowfullscreen="true"></iframe>
转码失败:文章增加前端跳转原网站的属性
vedio适配各个浏览器,均可播放,但是还为广泛使用
图片转码,存储
目标:在各个端可看
效果:图片转到我们的图床存储
特例:解决防盗链/过滤黄图
文本转码,存储
目标:各个端实现统一展示的样式
效果:去掉标签如:去掉div,保留p,b
表格转码,存储
目标:各个端实现统一展示的样式
效果:去掉标签如:
转码节点
二喵抓取的文章
文章入库到cms
用户投稿
编辑器实时转码
文章封面图截取
挑选文章中图片
图片筛选因子
格式不是png,jpg
图片比例不能与截取比例差很多
非灰度图
非人造图
人造图不符合人类审美,中心区域含有纯色块或纯色块的颜色过多,或颜色过少,或补色过多。
图片选择范围
通过图片筛选因子后
文章首尾前四后一
用户最想表达的五张图片
按顺序取4张图
排序因子
PCB: 图片是否含有纯色背景色块(Pure Color Band),过多的纯色块会使人不适。
RDH: 图片比例偏移值(Ratio Deviation Hold)图片比例是否相比目标窗口偏移很大
HSL(s): 图片饱和度,0.3-0.8之间人比较舒适。
HSL(l): 图片光照度,0.3-0.8之间人比较舒适等等
截取比例
参考twitter的截取策略,尽量对核心区域进行特写,有窗口既视感。
- 根据IPD计算出的兴趣点描述子,按照scale大小取top 25%的点,计算包围的bounding。
- 在此基础上外扩40%,作为最终bounding,进行图片截取。
- 根据目标窗口比例,进行适度缩放+截取。缩放采用ANTIALIAS模式,10级JPEG压缩等级进行存储,尽可能保留画质水准。
0 条评论
下一页