更新时间:2023-12-28 21:27
《互联网新闻开放协议》是百度新闻搜索制定的搜索引擎新闻源收录标准,网站可将发布的新闻内容制作成遵循此开放协议的XML(标准通用标记语言下的一个子集)格式的网页(独立于原有的新闻发布形式)供搜索引擎索引,将网站发布的新闻信息主动、及时地告知百度搜索引擎。采用了互联网新闻开放协议,就相当于网站的新闻被搜索引擎订阅,通过百度——全球最大中文搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问网站的新闻,进而给网站带来潜在的流量。
XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*
*
*
*
*——新闻url地址,与单篇新闻一一对应;若分页的新闻存在多个url,相当于多篇新闻。
*
*
*
开始之前,您需要了解以下几点:
无论您的网站已经成为百度新闻源,还是尚未被百度新闻搜索收录,您都可以使用此开放协议。
您使用开放协议提供的内容应全部为符合下面《新闻源收录标准》的新闻信息。
互联网新闻开放协议只是原始新闻源收录方式的一种协助和有益补充,而不是完全取代。
百度希望新闻源多样化,鼓励原创新闻内容,如果是具有大量有价值的新闻内容并能及时更新的正规、合法媒体网站,且网站服务器稳定、高速,就符合了百度收录新闻源的基本原则。
百度新闻搜索收录的内容包括时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等;是由专业人士撰写或编辑的中文信息;不包括发布的个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、食谱、下载、多媒体等其它类型、其它语言互联网信息。
可收录的网站类型:综合门户网站、专业新闻网站和地方信息港、报刊杂志及广播电视媒体、专业及行业网站、政府及组织网站;
不可收录的网站类型:论坛、博客、公司网站、个人网站、港澳台及海外媒体。
国内、国际、社会、财经、互联网、体育、娱乐:内容包括新闻报道、媒体评论、以及视频新闻报道;不包括敏感类政治新闻报道,反动新闻;
房产:内容包括业界新闻动态,家居;不包括房屋租赁信息;
汽车:内容包括新车导购、试驾;不包括车源信息;
游戏:内容包括业界新闻动态、游戏攻略、官方新闻;不包括游戏下载;
健康:内容包括保健养生、健康新闻、疾病预防;不包括食谱、两性话题;
科技:内容包括手机、数码、电脑产品行情资讯及评测,科普知识,业界新闻;不包括下载、产品报价类信息;
其他不可收录的分类还包括:个人信息、博客、论坛、广告、招标、报价、下载、试题、教程、招聘信息、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱;
百度新闻搜索希望收录高质量的中文新闻,不收录英文等其它非中文新闻;
您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。
请按遵照上面公布的开放协议内容制作XML文件。
其它说明: 支持的编码格式有GB2312、UTF-8、BIG5。
您可以将你网站某一时间段发布的全部新闻放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
请保持每个XML文件处于按更新周期持续自动更新状态。
每个XML文件至多存放最新发布的100条新闻,无需保存之前的新闻。
请将发布的新闻按照时间排序,即最新发布的新闻在最上端,否则可能有新闻被遗漏。
XML标签内容中的一些特殊字符必须转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的新闻,具体参见下表。 字符转义后的字符
HTML字符 字符编码
和(and) & & &
单引号 ' ' '
大于号 > > >
小于号 < < <
下面的位置提供了帮助您验证XML文件结构的多种工具:(参见资料)
通过验证的XML文件能够使您提供的信息更加标准化,确保您发布的新闻信息不被搜索引擎遗漏。
提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
百度新闻搜索将对你提交的数据进行测试和观察一周,若您按照互联网新闻开放协议的标准进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
注意: 百度新闻搜索不保证一定能收录您提交的全部内容。
*站点名、地址为必填项。
站点名 地址
如:百度 http://news.baidu.com/news.xml