网络信息采集与利用ppt要点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1网络信息采集与利用贾朝辉2本课程共九章第1章网络信息资源概论第2章网络信息处理方式及关键技术第3章搜索引擎及其使用第4章其他网络信息资源及其使用第5章联机检索技术及其应用第6章网络学术数据库信息采集第7章非万维网网络信息的采集第8章网络信息编辑第9章网络竞争情报采集与分析3第1章网络信息资源概论第一节互联网概况第二节网络信息资源概述第三节网络信息资源的类型第四节网络信息资源检索第五节网络信息采集与利用的未来趋势4第一节互联网概况一、互联网在中国的发展二、互联网术语1.通信协议2.IP地址3.子网和子网掩码4.域名系统5.中文域名6.网络实名7.局域网及广域网8.Internet服务器5第一节互联网概况三、Internet提供的服务1.电子邮件2.电子公告板3.远程登录4.网络新闻5.文件传输协议6.博客7.其他服务6第一节互联网概况四、计算机网络安全1.防火墙技术2.密码技术7第二节网络信息资源概述一、网络信息资源的含义二、网络信息资源的特点存储数字化表现形式多样化以网络为传输媒介传播方式的动态性信息源复杂8第三节网络信息资源的类型一、按所对应的非网络信息资源分类二、按人类信息交流的方式分类三、按信息存取方式分类四、按网络信息资源的层次分类9第四节网络信息资源检索一、网络信息资源检索的方法浏览信息借助网络检索工具利用搜索引擎在线数据库查询10第四节网络信息资源检索二、网络信息资源检索的技巧主题指南与搜索引擎相结合缩小检索范围扩大检索范围使用组合搜索关键词强制搜索模糊搜索先思考先分析11第四节网络信息资源检索三、影响网络信息资源检索的因素信息资源的质量检索软件用户水平四、提高网络信息资源检索效率的方法培养“信息素养”不断探索、积累经验、提高信息获取能力12第五节网络信息采集与利用的未来趋势一、网络检索自动化技术的发展二、多媒体技术的应用三、多语种检索四、检索工具智能化13第2章网络信息处理方式及关键技术第一节文献标引理论第二节检索语言第三节计算机信息检索第四节元数据技术第五节中文自动分词处理技术第六节文本自动处理技术第七节网络信息挖掘14第一节文献标引理论一、文献标引的概念1.文献标引的目的及意义2.文献标引的方式3.主题标引与分类标引的异同15第一节文献标引理论二、文献分类标引原则1.学科属性原则2.专指性原3.实用性原4.系统性原则5.逻辑性原则6.一致性原则7.“其他”类原则8.入上位类或依论述重点归类原则9.新学科、新主题文献分类原则16第一节文献标引理论三、文献主题标引1.特征2.类型四、网络信息资源的分类标引17第二节检索语言一、检索语言的概念二、检索语言的分类1.分类语言2.主题语言18第三节计算机信息检索一、计算机信息检索概述1.计算机信息检索概念2.计算机信息检索的特点3.计算机信息检索系统的构成4.计算机信息检索系统的分类19第三节计算机信息检索二、计算机信息检索技术1.布尔逻辑检索2.截词检索3.字段检索4.位置算符检索5.全文检索20第四节元数据技术一、元数据的概念二、元数据的应用1.元数据的应用目的2.元数据的应用领域3.Metadata格式的应用现状21第五节中文自动分词处理技术一、中文自动分词概述二、中文文献的索引方法1.基于字符串匹配的分词方法2.基于统计的分词方法3.基于理解的分词方法三、简单的匹配方法1.正向减字最大匹配法(MM)2.逆向减字最大匹配法(RMM)3.正/逆向结合的方法22第五节中文自动分词处理技术四、典型自动分词系统介绍1.早期的自动分词系统2.清华大学SEGTAG系统3.复旦分词系统23第六节文本自动处理技术一、文本自动处理技术概述二、文本自动分类1.数据准备2.训练3.运行三、文本自动聚类四、自动文摘24第七节网络信息挖掘一、网络信息挖掘中的关键技术1.目标样本的特征提取2.中文分词处理3.获取网络中的动态信息二、网络信息挖掘技术流程的实现三、网络信息挖掘技术在搜索引擎中的应用25第3章搜索引擎及其使用第一节搜索引擎概述第二节搜索技术基础第三节搜索引擎Google的使用第四节百度搜索的使用第五节特色搜索引擎26第一节搜索引擎概述一、搜索引擎的历史二、搜索引擎的分类三、搜索引擎的工作原理四、搜索引擎的组成五、搜索引擎的性能指标27第一节搜索引擎概述六、搜索引擎面临的挑战1.网络信息量迅猛增加2.网络信息的无序化3.信息的有用性评价困难4.网络信息日新月异的变化5.带宽等其他因素28第一节搜索引擎概述七、搜索引擎的未来发展1.破解用户之意,信息抽取,优化排序2.基于视觉网页块分析3.网页库内容分类4.潜在相关性5.网页结构化信息抽取类技术6.自然语言处理,简单的语意语法分析7.重复识别29第一节搜索引擎概述8.行业优化9.相关搜索10.采集更多的数据11.跟踪互联网变化,进行细节上的优化30第一节搜索引擎概述八、常用搜索引擎简介1.英文搜索引擎2.中文搜索引擎31第二节搜索技术基础一、基本的搜索技巧1.简单信息查找2.使用双引号进行精确查找3.使用加减号限定查找4.有针对性地选用搜索引擎5.细化查询6.根据需求选择查询方法32第二节搜索技术基础7.注意细节8.利用选项界定查询9.尽可能将搜索范围限定在特定的领域里10.使用更特定的词汇33第二节搜索技术基础二、快速搜索技巧1.搜索词组2.选择词组3.查找信息源34第三节搜索引擎Google的使用一、Google简介二、Google的使用方法1.首页介绍2.基本搜索3.辅助搜索4.进阶搜索5.其他语法6.图片搜索35第三节搜索引擎Google的使用7.目录搜索8.新闻组(Usenet)搜索9.新闻搜索10.其他功能36第四节百度搜索的使用一、百度简介二、百度搜索的使用方法1.基本语法2.百度新闻搜索3.百度MP3搜索4.百度图片搜索5.百度贴吧搜索6.百度中文搜索风云榜7.百度搜索工具37第五节特色搜索引擎一、图片搜索1.中文图片搜索引擎2.英文图片搜索引擎二、FTP搜索引擎三、新闻组搜索四、新闻搜索引擎五、MP3搜索引擎1.中搜MP3搜索2.搜刮网(SoGua)38第五节特色搜索引擎六、Flash搜索引擎七、其他特色搜索引擎1.字典搜索2.地图搜索3.域名搜索和IP搜索4.寻人搜索5.科技搜索引擎39第4章其他网络信息资源及其利用第一节网页浏览器及使用技巧第二节网络目录的利用第三节虚拟图书馆资源的挖掘40第一节网页浏览器及使用技巧一、InternetExplore8浏览器1.IE8.0的安装2.初次启动3.IE8.0新增的功能二、其他浏览器1.MozillaFirefox浏览器2.Opera浏览器41第一节网页浏览器及使用技巧3.Safari浏览器4.可在线翻译的FastBrowser浏览器三、离线浏览器1.OfflineExplorerPro浏览器2.WebZip浏览器3.WebReaper浏览器42第二节网络目录的利用一、网络目录概述1.目录资源的收集和分类2.网络目录结构3.网络目录分类方法4.网络目录与搜索引擎的比较43第二节网络目录的利用二、OpenDirectoryProjectODP的由来分类44第二节网络目录的利用三、其他优秀网络目录简介LookSmartGalaxyAboutAskJeevesSinasohu45第二节网络目录的利用四、专业目录的使用EEVLInternet精英搜索46第三节虚拟图书馆资源的挖掘一、虚拟图书馆概述相关概念虚拟图书馆与数字图书馆的比较虚拟图书馆设计原理47第二节网络目录的利用二、虚拟图书馆资源及其利用虚拟图书馆列治文公共图书馆化学虚拟图书馆虚拟运输图书馆澳门虚拟图书馆数字虚拟图书馆清华大学虚拟图书馆大英图书馆48第5章联机检索技术及其应用第一节联机检索概述第二节主要国际联机检索简介49第一节联机检索概述一、联机检索概况二、联机检索的特点三、联机检索的服务范围50第二节主要国际联机检索简介一、DIALOG系统二、Questel-Orbit三、ESA-IRS四、STN系统五、OCLCFirstSearch51第6章网络学术数据库信息采集第一节中国高等教育文献保障系统第二节万方数据资源系统第三节中文全文型期刊数据库—中国知网第四节中文图书数据库第五节综合性数据库——EIVillage第六节全文电子期刊52第一节中国高等教育文献保障系统一、CALIS的概况二、CALIS的主要服务内容CALIS联合目录公共检索系统联机编目集团采购文献传递网53第二节万方数据资源系统一、万方数据资源系统概况二、万方数据资源的内容期刊论文学位论文会议论文专利成果法规标准企业信息西文期刊论文西文会议论文科技动态54第三节中文全文型期刊数据库——中国知网一、中国知网简介二、中国知识资源总库系列元数据库系列专业知识仓库系列知识元数据仓库其他55第四节中文图书数据库一、超星数字图书馆二、书生之家主页板块介绍检索图书阅读器56第五节综合性数据库——EIVillage一、简介二、数据库介绍Compendex数据库Inspec数据库NTIS数据库57第五节综合性数据库——EIVillage三、检索方法快速检索专家检索词典检索检索历史四、辅助索引58第六节全文电子期刊一、ElsevierScienceDirectOnSite数据库简介检索指南二、IEEE/IEEElectronicLibrary简介检索方法三、SpringerLink简介检索途径59第七章非万维网网络信息的采集第一节FTP第二节邮件列表第三节Usenet第四节Telnet和BBS60第一节FTP一、FTP简介FTP服务器和客户端FTP登录二、FTP搜索引擎61第一节FTP三、FTP信息资源的获取CuteFTPFTP信息资源的解读技巧四、知名FTP资源62第二节邮件列表一、邮件列表简介二、邮件列表的使用方法和技巧深沪股市行情综合性中文邮件列表HAMWinNews63第三节UsenetUsenet简介特点64第四节Telnet和BBS一、Telnet二、BBS65第八章网络信息编辑第一节信息筛选第二节网络信息制作66第一节信息筛选一、网络信息的价值判断真实性权威性时效性趣味性实用性二、与网络信息收集有关的知识产权问题67第一节信息筛选二、与网络信息收集有关的知识产权问题网络在知识产权方面存在的问题68第二节网络信息制作一、单篇稿件的加工稿件的修改稿件的改正稿件的增补稿件的提炼稿件的标题制作二、多篇稿件的整合三、网络信息的组织69第二节网络信息制作二、多篇稿件的整合围绕稿件进行整合围绕事件进行整合围绕主题进行整合三、网络信息的组织70第二节网络信息制作三、网络信息的组织高效导读恰当评价物尽其用71第九章网络竞争情报采集与分析第一节竞争情报的基本概念第二节竞争情报的获取第三节竞争情报的分析方法72第一节竞争情报的基本概念竞争情报功能73第二节竞争情报的获取一、竞争情报的获取策略1.竞争情报工作的一般步骤2.明确“需”与“求”3.连续性和系统性原则确定检索语言74第二节竞争情报的获取二、信息源及竞争对手情报的获取方法公开资料电子信息源人际关系网会议信息75第三节竞争情报的分析方法一、SWOT分析法二、专利分析三、财务报表分析四、竞争对手跟踪

1 / 75
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功