第九讲:信息与大数据的伦理问题•1、案例引导•2、从数据化到数据主义•3、信息与大数据伦理问题•4、数字身份困境•5、大数据时代个人隐私•6、大数据公共治理伦理•7、大数据创新科技人员的伦理责任引导案例:“棱镜门”下的隐私权•棱镜计划(PRISM)是一项由美国国家安全局(NSA)自2007年小布什时期起开始实施的绝密电子监听计划,该计划的正式名号为“US-984XN”。•英国《卫报》和美国《华盛顿邮报》2013年6月6日报道,美国国家安全局(NSA)和联邦调查局(FBI)于2007年启动了一个代号为“棱镜”的秘密监控项目,直接进入美国网际网路公司的中心服务器里挖掘数据、收集情报,包括微软、雅虎、谷歌、苹果等在内的9家国际网络巨头皆参与其中•国家安全局在PRISM计划中可以获得的数据电子邮件、视频和语音交谈、影片、照片、VoIP交谈内容、档案传输、登入通知,以及社交网络细节。综合情报文件“总统每日简报”中在2012年内在1,477个计划使用了来自PRISM计划的资料。•关于PRISM的报道是在美国政府持续秘密地要求威讯(Verizon)向国家安全局提供所有客户每日电话记录的消息曝光後不久出现的。泄露这些绝密文件的是国家安全局合约外判商的员工爱德华·斯诺登。他原本在夏威夷的国家安全局办公室工作,在2013年5月将文件复制后前往香港将文件公开。2、facebook信息泄露丑闻一家剑桥数据分析公司,非法获取5000万Facebook用户的个人信息3、大数据三大战争•阿里VS顺丰快递;抢夺数据的保管权(保护用户数据不被窃取),用户在淘宝上购买商品,用顺丰快递,将不能在淘宝上查询到相关信息,这将意味着淘宝订单无法顺丰发货了。•京东VS天天快递(投诉多,口碑差,拒绝合作)背后大股东是苏宁,苏宁背后是阿里(百世通、圆通等)(实际上防止用户数据被抓取);•华为和腾讯•大数据成为基础设施;类似水、电、能源一样的基础社会•李彦宏:人工智能时代依靠数据和算法驱动,而不是石油•腾讯有10亿用户的庞大数据库(写字楼里的各种公司),华为有手机(写字楼和物业)用户的数据缺乏用户消费、网购、社交和搜索。•数据属于谁?使用权和所有权?用户同意?也不是华为也不腾讯的?4、阿里巴巴数据公司•阿里巴巴本质上是一家什么公司:“我们集团本质上是一家扩大数据价值的公司,和未来潜力相比,云计算和大数据还是只是个婴儿”•阿里健康:收集药品实时数据•滴滴快车和高德地图:收集用户的出行数据•微博和入股的陌陌:收集社交关系的数据•优酷土豆、阿里影业和光线:收集线上娱乐数据•恒生电子:证券交易数据•菜鸟网络:收集物流数据•蚂蚁金服:收集支付数据•口碑和饿了么:收集餐饮数据•淘宝和天猫:交易消费数据5、对大数据应用的伦理提问•一个人在网络上的数字身份(账户、马甲)与他/她的社会身份在法律上可否认为是一致的?•电话号码、住址等个人数据是否全部属于个人隐私,必须受到严格保护?•关于“我”的数据权利应该属于“我本人”还是“BAT公司”?•如果因各种原因与“我”相关的数据已被“我”授权给信息平台使用并产生了未知收益,“我”有权参与分配吗?如果无权,为什么?如有有权,怎么定价?•让未经证实的消息甚至谣言自由地、无边界地在互联网传播,已经造成了普通人的声誉、财产损失甚至生命代价。面对这种后果,该不该治理与管控?怎么治理?•生活在网络化、大数据时代的“我”怎样才能保有自身安全?•将大数据技术用于预测危险社区、易犯罪人群是否涉嫌歧视和侵犯人权?•假设法国政府因为采用大数据预测而提前成功阻止了2015年11月13日发生在法国巴黎、致使100多名无辜群众遇难的暴恐袭击,是否应当受到赞扬和肯定?大数据时代的来临•1、大数据是21世纪的“新石油”,是时代变革和经济社会发展的推动力。••2、大数据信息价值开发涉及科技、商业、医疗、教育、人文以及社会生活的各个领域。在互联网、云计算和海量数据存储技术的推动下,大数据已成为全球科技界、企业界、学术界和各国政府关注的焦点,各行各业高度重视研究和开发大数据潜藏的价值。•3、世界各国的大数据战略•联合国高度重视大数据的研发。2009年联合国也正式开启了“全球脉动”项目,旨在数据获取、存储和分析方式的创新,希望通过“大数据”来预测和判断某局部地区出现的经济、社会、政治和自然等因素引起的重大问题,以提前部署援助项目和支持力度。•2012年联合国就大数据的研发做了进一步的规划和部署•2010年11月,德国联邦政府发布了《信息与通讯技术战略:2015数字化德国》•2013年2月,法国总理让-马克-艾罗在“2012年欧洲数字化战略”所定目标的框架内,提出法国政府数字化路线图,旨在通过推进数字化建设,为年轻人提供更多的就业机会,利用数字化提高企业的竞争力。•《欧盟开放数据战略》则将重点放在大数据技术处理、数据门户网站以及科学研究数据基础设施等几大领域,使欧洲企业和社会公众能够更加便捷快速地获得以政府为主的公共组织信息,建立一个汇集不同成员国及欧洲机构数据的“泛欧门户”•美国奥巴马政府在2012年就投入两亿美元支持“大数据研发计划”,旨在增强海量数据收集、存储和处理能力,这事关美国的国家安全和未来竞争力。他们主张未来对“大数据”的研发能力将成为国家竞争力的重要组成部分,是国家的重要战略资源。•2015年9月,国务院发布了《促进大数据发展行动纲要》。这是我国关于大数据研发的顶层设计,是指导未来大数据信息价值开发的纲领性文件,旨在推进数据资源的开放、共享和开发,完善电信、网络普遍服务机制,超前布局下一代互联网和大数据的发展战略18大数据4V特征结构化数据、半结构化数据和非结构化数据如今的数据类型早已不是单一的文本形式,网络日志、音频、视频、图片、地理位置信息等,对数据的处理能力提出了更高要求实时获取需要的信息比如:在客户每次浏览页面,每次下订单过程中都会对用户进行实时的推荐,决策已经变得实时数据量巨大全球在2010年正式进入ZB时代,IDC预计到2020年,全球将总共拥有35ZB的数据量沙里淘金,价值密度低虽然数据量很大,但是价值密度较低,如何通过强大的机器算法更迅速地完成数据价值“提纯”,是目前大数据亟待解决的难题大数据产品市场价值解决方案转化1.海量(Volume)3.速度(Velocity)4.价值(value)2.多样(Variety)10.2信息与网络空间伦理•1、人际关系虚拟化•推特、脸书、博客等各种社交平台,线上真假互存的社交活动越来越侵占人更多时间•深度交往?2、不正当的网络行为•发明病毒、木马共计他人信息系统、偷窥他人信息、偷到他人软件或账户、从事非法走私、色情、毒品。•“匿名”身份难以追责平等与公正•越来越多社会活动和机会依赖网络空间•信息贫困群体或地区如老年人、残疾人、受教育少的人群等•谁有责任向“信息贫困”人群提供相关技术、服务和平等生存的伦理责任?如何去行动?知识产权争议•信息时代,拥有和控制信息是通向财富、权力和成功的关键。•数字化信息容易复制、携带、修改、传输和获取。•搜寻他人的信息作品进行改造成自己的作品,是否正当?全球化信息交互治理困境•网上可以自由跨越国界;使得公民参与民主过程中,国家政府决策和管理更公开?行为更透明?更负责?•黑客攻击?网络瘫痪?如何网络管控?避免恐怖袭击?•互联网“地球村”,如何形成对全球化信息交互利益和风险的共识,又该如何共同参与建立正当合宜的全球政策和治理框架?10.2.2大数据时代伦理新问题•大数据时代,作为技术应用提供方的数据工程师,大数据创新企业,政府部门,与作为使用方的普通用户,社会推按提,共同面对以下新的更集中的伦理挑战:10.3数字身份困境•人的身份,用来界定一个人是谁或是什么?具有可识别性、独特性、唯一性。•数字身份,是在网络空间领域非常流行的概念,是描述一个主体或实体的数据,是有关一个人的所有在数字上可得的信息的总和。大数据引发的数字身份新问题•数字身份具有重要的商业价值•数字身份被盗用,造成财产损失(12306)•数字身份被追溯:“人肉搜素”实名制伦理考量•网络用户、运营商、学者和政府对网络实名制治理政策是否正当?10.4大数据时代的个人隐私•个人信息收集:收集公开数据、公开收集数据、日志文件、隐藏式收集、攻击破解、买卖、关联推断•1、隐私问题•大数据时代之前相比,现在大量的个人隐私信息被收集,更能挖掘出其潜在的价值,且更难控制,更难追究责任。大量数据的收集是信息价值开发的首要前提,现代互联网具有开放性、共享性和全球性等特征,也正是在这样开放的网络环境下,大数据信息价值开发更容易通过强大的大数据技术获取大量的原始数据,更容易将从前属于个人隐私领域的信息视为公共信息,从而导致对隐私权的侵犯。•大数据价值开发的一个核心任务是预测人未来的可能行为,预测与人相关事物的未来可能状态,通过强大的数学算法对大量数据进行处理、分析,由此来预测未来事情可能发生的状态。•不同人的坐姿、不同人的声音、婴儿生命体征、搜索关键词,引擎的震动、机票销售等,通过量化方法把这些情形转化为数据,对这类数据进行挖掘,开发出更多的有创新性价值的产品或建议。•Farecast利用机票销售数据来预测未来的机票价格趋势;•根据某人的坐姿和体重在汽车座椅上安装防盗系统;•根据不同的声音来完善语音识别系统;•麦格雷戈博士通过婴儿的生命体征来预测传染病的发生;•谷歌使用搜索关键词来监测流感的传播;•根据引擎的散热和震动来预测引擎是否会出现故障,•这些情形表明,可以从日常的大数据中挖掘出未被开发的潜在价值。•通过数据分析和挖掘,开发这些信息的潜在价值,进行定向营销,可能导致对个人隐私权的侵犯。•例如,某商场通过分析客户购物行为的数据,对某特定客户进行个性化的定向推销,导致一位父亲抗议商场给她只有十几岁的女儿推荐怀孕和婴儿用品。•公司能够通过对不同类的大数据进行重组准确定位特定客户的身体健康状况,•个性化推荐治疗梅毒的相关方法和药物;•公司也有可能通过多种数据的组合,挖掘出某两个人之间有婚外情或同性恋10.5数据权利•数据资产属性与数据权属财产必备的三要素:被他拥有和控制;能够用货币来衡量;能为他带来经济利益数据是否具备这些特性?10.6大数据公共治理伦理•中西公共治理价值观的差异•家国天下传统社会伦理的中华价值观表现:•(1)责任先于自由•(2)义务先于权利•(3)群体高于个人•(4)和谐高于冲突大数据公共治理的伦理选择•大数据公共治理的伦理困境表现在;•一方面网络和信息技术使得实施网络信息管控异常方便;•另一方面怎么界定、保护、转换或授权用户的信息访问控制权还未形成社会共识。•信息惠民:方便和安全、和谐美好10.7大数据创新科技人员的伦理责任•科技人员的伦理责任意识•从构思、设计、开发、投入市场、使用到服务乃至退出市场,科技人员首先面对的是企业和客户•其次需要面对非客户的社会大众和政府•正确识别各类责任主体的利益关注点,理解他们的价值追求及行为动机,是大数据创新科技人员必须具备的伦理责任意识大数据创新科技人员的伦理责任•1、尊重个人自由•大数据时代,尊重个人自由,很大程度上表现为遵从隐私伦理道德。•2、强化技术保护•通过不断完善信息系统安全性能,部署防火墙,入侵检测系统,防病毒系统,认证系统,采取访问过滤、动态密码保护、登录限制,网络攻击追踪方法的技术手段,强化应用数据的脱敏处理、存取管理、业务审计,确保系统中的用户个人信息得到更加稳妥的安全技术防护。3、严格操作规程•制定严密的数据管理和追责制度,包括数据获取、清洗、存储、传输、分享、交易、关联分析等环节的权限管理和访问日志,规范所有能接触到数据及其算法的人员的操作行为•4、加强行业自律•努力培育和强化行业自律机制,发挥行业自律的灵活性和专业性优势,弥补法律法规滞后的缺陷。•重点行业应制定自律规范和自律公约,规范大数据的使用方式和标准流程5、承担社会责任•共同承担建设社会安全、可信、平等、可及、惠民的大数据社会责任,避免发明伤害他人、涉嫌歧视、损害名誉、降低道德水平的大数据产品和服务,在企业私利