版权保护与技术——百度文库百度文库简介百度文库是百度发布的供网友在线分享文档的平台。百度文库的文档由百度用户上传,需要经过百度的审核才能发布,百度自身不编辑或修改用户上传的文档内容。网友可以在线阅读和下载这些文档。百度文库的文档包括教学资料、考试题库、专业资料、公文写作、法律文件等多个领域的资料。百度用户上传文档可以得到一定的积分,下载有标价的文档则需要消耗积分。当前平台支持主流的doc(.docx)、.ppt(.pptx)、.xls(.xlsx)、.pot、.pps、.vsd、.rtf、.wps、.et、.dps、.pdf、.txt文件格式。优质文档优质文档付费文档优质文档的五项规范格式美观度文档完整度失效新颖度内容独创度整体观感好,格式规范,无乱码、无错别字符段落文档内容有头有尾,不残缺无明显段落损失,没有广告文档内容不过时,能一定程度结合当下热点问题内容可适当参照,不可照抄,需经过上传者精心加工编辑操作度可供阅读者下载后易于编辑,可修改度高,可错作性强专家名师文章作者付费文档付费文档百度知识产权电子书•电子书是随着计算机技术和网络技术的发展而形成的产物,它将文字、图像和声音进行了数字化。•电子书需要依附于计算机、手机和阅读器等载体。•电子书是可以进行存储和阅读的数字化内容。定义特点•节约资源,绿色环保•携带方便,储存量大•检索快捷,互动性强•信息融合,购买方便百度案例上海3月28日贾平凹、韩寒等知名作家状告百度文库盗版使得网络侵权再次浮出水面。3月24日,百度文库与出版界代表为解决侵权纠纷进行的谈判正式破裂,意味着这一侵权纠纷可能走向法律程序。记者采访发现,利益分享机制失衡、法律威慑不足、公众知识产权保护意识薄弱,是网络侵权屡禁难止的原因。2011年3月15日,贾平凹、韩寒等50位作家公开发布《中国作家声讨百度书》,指责百度文库“偷走了我们的作品,偷走了我们的权利,偷走了我们的财物,把百度文库变成了一个贼赃市场”。两天后,中国音像协会唱片工作委员会加入“战团”,公开声援文学界维权的呼吁和行动。这使得百度再次陷入知识产权侵权的舆论漩涡。此前,盛大文学亦曾起诉百度文库侵权,称“百度文库不死,中国原创文学必亡”。2010年12月,文著协、盛大文学与磨铁图书公司共同发表了《针对百度文库侵权盗版的联合声明》,称“必将与百度文库的侵权盗版行为斗争到底”。面对“炮轰”和“声讨”,百度对外宣布,文库只是一种资料分享模式,因而并未侵害他人权益。所有的文稿、档案等资料均来自网友上传,而百度本身并不上传侵权的书籍和作品,因此也就不构成所谓的“侵权”。百度案例2011年3月29日,百度正式推出了文库合作平台,提出广告分成和付费分成两种与版权方的合作模式,即版权方可以自由选择合作模式或者提出其他合作模式。无论何种模式,都会在版权方授权的前提下进行,且版权方都将获得大部分收益。截至2011年8月,与百度合作版权方已达到55家,包括文汇出版社、蓝狮子、文化艺术出版社等。同时,百度文库尝试与百度框计算开放平台进行对接,即版权方向文库提交的正版内容,通过编辑与开放平台对接后,将会为用户带来最佳的正版阅读体验,有效地打击网络盗版,促进中国网络文学产业的高速健康发展。2011年10月,百度与中国文字著作权协会正式签署战略合作协议。百度与作家出版集团、中国作家协会的合作也进展顺利。版权管理创新01030204为权利人提供在线投诉、电子邮件投诉、电话投诉、传真投诉、邮寄投诉等多种投诉渠道,权利人发送通知且百度收到通知核实无误后会立即删除相关侵权内容,情况复杂的,会在24小时内删除可能涉及侵犯他人版权的文档,除非上传者是该文档的合法权利人或该文档不侵犯任何第三方的合法权益。上传者侵犯他人版权,导致上传内容被删除的,百度将通过系统将删除原因通知上传者,并教育上传者不得再次上传侵权内容。对于反复上传侵犯他人著作权者,百度将根据上传者侵权的严重程度,采取扣除积分、加倍扣除积分、限期禁ID、永久禁ID或永久禁IP等处罚措施。由战略合作伙伴直接录入涉嫌侵权链接,减少审核环节。目前,百度文库已为400多家出版社开设绿色通道即防止载有出版、版权标识和再版编目的作品,一般公众所熟知的知名作者、制作者的作品或知名度较高的作品以及处于热播、热卖期间的作品上传。提供通知删除渠道为权利人提供绿色通道,免除版权证明对上传者加强管理建立主动审查机制版权技术创新该系统利用正版作品原信息作为识别的基因,机器自动提取作品中的基因,比对文库中已有文档和用户新上传文档,如文档基因符合率达到80%,则现有文档和用户新上传文档即被认为是盗版文档。该系统运行中召回盗版率为100%,准确率为95%。目前已有多家出版社和权利人使用了该系统。此系统被业界认为,可实质性的解决文库存在的侵权盗版问题,绝大部分解决盗版的源头问题。今后,百度将持续开发应用能够有效保护版权人合法权益的技术手段和工具,以期更好的落实百度版权保护的战略目标。DNA反盗版文档识别系统版权技术创新•作家如果想保护其作品,必须要先将作品交给百度文库;•百度文库通过扫描版权作品内容,生成“识别特征点”;•利用获得的“识别特征点”与百度文库用户拟上传的文档通过计算机进行比对;•若用户拟上传的文档“识别特征点”与作家作品的“识别特征点”相符,则说明侵权,不允许用户上传该文档;若不相符,则允许用户上传。DNA反盗版文档识别系统核心思想版权技术创新版权技术创新源检索的组成部分:文本分块:分块的原则是在不改变原文章、原段落意思的基础上将文章切分为若干个子文本块。将文章分成若干个子块的目的是为了平衡各段落在提取关键词时的作用,使得无论是长篇幅的段落或是短篇幅的段落都可以用于提取关键词。关键词提取:关键词提取的基本原理是选择一些能够将检索的源文档与可疑文档匹配最大化的短语或者词项。换言之,选择的词项组成的查询要尽可能的获取到与可疑文档相匹配的源文档。关键词的提取也可以作为限制组成查询量的手段,从而减少使用搜索引擎的整体成本。查询构建:给定从文本块中提取的词汇集合,将它们构建成满足于查询所使用的搜索引擎API,例如:百度搜索引擎的查询限制在38个汉字以内,超出限制范围的字词均会被忽略。搜索控制:基本原理是动态地调整基于每个查询结果的搜索,可以包括丢弃查询,重新组织现有的查询词,或基于从搜索结果中所获得的相关反馈组织新的查询,总之搜索控制为获取检索结果服务。检索结果过滤:该阶段的操作进一步降低候选集的文档数量,并保存以备后续的详细文档比较步骤的调用。检索结果过滤为抄袭检测文本对齐任务的研究减轻了文本比对的压力。存在的不足电子书内容审核方面不足缺乏版权意识版权保护技术面临阻碍预防网络文学抄袭1.技术手段调色盘,是现在在互联网上新兴的一种界定内容产品是否抄袭的手段。调色盘多采用表格形式,将疑似抄袭文与原文截取各种相似片段并分列左右进行对比,其中雷同的句子采用鲜艳的颜色进行标明。根据作者喜好可旁附解释。在网络空间中,用户利用Word、Excel等技术,将有抄袭嫌疑的文章和原文放在一起,制作出一组表格进行对比,抄袭文和被抄袭文左右列表,疑似被抄袭的文字段相对应并用颜色重点圈出来,即用相同底色标注雷同内容。现在网络文学对于上面那种“同人作品”是否存在抄袭或者侵权问题采用的还大多是这种“调色盘”鉴定模式。2.简化网络文学抄袭案件的诉讼程序司法救济作为当前被抄袭者维权的最后也最重要的手段,面临着成本高、执行差、耗时长等问题。所以在司法实践中可以简化网络文学抄袭案件的诉讼程序,提高审理效率。预防网络文学抄袭3.建立网络文学抄袭者“黑名单”在网络文学创作实名制的基础上,针对抄袭者建立网络文学“黑名单”,公布抄袭者的作品、真实身份信息和刊登作品的平台。一方面,这有利于各网络文学平台监管平台创作者。另一方面,建立网络文学抄袭者“黑名单”,可以对网络文学产业化提供保障。现今的改编影视剧的热门网络IP无不惹上抄袭的阴影,如果作品被公布在“黑名单”中,促使改编者谨慎购买版权,让改编的影视剧摆脱抄袭的原罪。2016年11月发布的《关于加强网络文学作品版权管理的通知》中就规定了网络服务商“黑名单”,但是只局限于网络文学侵权盗版问题。这一制度应拓展至处理网络文学抄袭问题,而且也不仅仅只针对网络服务商。4.加重网络文学抄袭者责任在司法实践中,对网络文学抄袭者的惩罚力度远远不够。近几年来,网络热门IP价值越来越巨大,作为文化产链中的第一线网络文学被抄袭后,被抄袭者却不能获得足够的赔偿,甚至得不到抄袭者的公开道歉。所以,司法救济应该增加惩罚性措施,大幅增加抄袭者的违法成本。检测文章核心功能热点追踪爆文分析质量检测大数据追踪各大媒体平台时事热点、热词,赋能爆文创作。实时分析各大平台爆文推荐机制,洞察爆文秘密。通过易撰大数据及各大搜索平台,自媒体平台数据,判定原创值、值标题风险,进行质量评定并给予建议发布平台和领域推荐。稀缺内容分析大数据追踪创作话题在各大平台的内容量稀缺程度,迎合推荐机制,避免内容饱和带来的推荐下降。感谢聆听!