OverDrive发布2012电子书借阅数据
上周美国最大的图书馆电子书服务供应商Overdrive发布了2012年电子书流通情况数据,主要数据如下:
- 向2.2万家图书馆提供服务;
- 总访问次数1.92亿,比2011年增长93%;
- 27亿页次的目录访问,比上年增长65%;
- 电子书比上年新增30万种,总量超100万(包括电子书、有声读物、声像资料等);
- 移动访问数量增加47%;
- 阅读客户端1600万次下载;
- 年度总借阅数7000万册次。
上周美国最大的图书馆电子书服务供应商Overdrive发布了2012年电子书流通情况数据,主要数据如下:
今天又回答了一位网友的提问,顺便把回答贴上来,也期望有更多的人看到。星星之火,点燃更多的人。
关联数据能够对一个企业或机构带来怎样的好处呢?其实现在的企业、组织机构与图书情报单位差不多,IT用得较早较多的,都已经有了很多系统了:业务管理系统、办公自动化系统、人事系统、财务系统、销售系统、客户管理系统、库存系统、物流系统……,很多单位有了这些系统却找不到数据,每次用到数据(例如人员数据)都要重新填表,效率和一致性都成问题。
如何使这些系统协同、特别是数据得到重用,是个很大的问题。以关联数据为代表的语义技术正是在数据整合乃至业务整合方面,能够发挥巨大作用,确保已有的大量产品(对象)数据或其它数据方便有效地跨系统得到使用。用一个时髦名词,就是“基于语义的系统(数据)集成”。
很多情况下企业都是通过XML消息或其它B2B标准实现跨系统信息通信,但是当一个企业内拥有几十个系统,管理着不同的业务过程,涉及上万个实体(产品、零件、藏品…)时,正确地描述每一个产品的复杂属性和取值,取得数据的一致性不是一件容易的事情。一棵再强大的XML DOM树也无法对付高度复杂的多维链接关系。答案只有一个:用图式数据(graph)。
关联数据的价值就在此时显现出来。它向数据消费方提供一个单一的、可信的、易用的实体对象数据源。关联数据自身就是开放的API,对最终用户的好处就是:发布在网站上的信息、数据表、选单、指南、合作伙伴的信息、链接信息等,能够保持高度的一致性,特别是能够解决更新时的一致性问题。
怎么做?
根据LD的发布原则,首先确立每一个独立存在的实体对象(例如产品、供应商),赋予他们唯一的HTTP URI作为标识。在系统后台可能要支持这些对象数据原有的管理系统,例如他们是通过XML RPC接口过来,还是CSV格式,还是RDBMS的,都要转成RDF是肯定的。
RDF的一个很好的特性是合并数据非常容易,能够从不同的来源很容易地进行合并,而此时如果采用大数据解决方案,例如采用图形NoSQL数据库,则更体现了灵活性。
为这类RDF图形数据库建立查询“端点(endpoint)”是很容易的,然后我们就可以通过SPARQL标准进行查询。
这里有个工具Dydra,它是一个数据库作为一种服务(Database as a Service)的云服务。可以作为小应用“试水”,边用边学。你只需要上载你的RDF数据即可。目前此类工具已经很多了,而且很强大,例如最新的Apache Jena和OpenRDF Sesame项目成果,或者“关联数据平台(LDP)”如Graphity。它们已经能够支持非常“傻瓜”地建立关联数据系统,支持很快地建立API,存取不同来源的数据,甚至能够支持非常复杂的提问。这种基于语义的整合具有过去系统所不具有的深度(智能)查询能力,如果发展得足够快,应该能应用于下一代“图书馆服务平台LSP”中。
当一个查询命中一个产品标识(以HTTP URI形式)时,这个URL是可“解引(deferencable)”的,意味着可以支持“内容协商机制(negotiation)”,按照不同的请求提供不同的数据,浏览器(人工请求)就提供HTML,机器请求就提供XML、JSON或Turtle格式的RDF数据。Graphity采用Jave和XSLT2.0,通用性很强。
如果该企业或组织机构的数据具有一定的通用性,它愿意作为一种“规范数据”发布到公网上,在一定的开放协议下提供公共服务(如果是商业服务可以收费),这些数据的模型(本体)和描述规范(元数据规范)还能构成领域标准,将使企业或组织机构的价值得到更大的提升。
公共图书馆服务体系是一个城市公共文化服务体系的重要组成部分。从我们的角度来看,有两个定位,
第一个定位:它是公共文化服务的最重要和最稳定的基础设施。它具有专业性和职业性。它的基础性反映在人口覆盖率、地理覆盖上和服务性质上。在国外称得上国际化大都市的中心城市,公共图书馆服务的人口覆盖率大约在60%-80%,地理覆盖有一个概念,叫15分钟生活圈。服务性质是普遍均等的保障性基本服务,一年365天,面向360行,同时它既是一个场所,又可以提供基于网络的不打烊的服务。体现了一种政府向人民群众提供的文化保障。
第二个定位:它是“开展全民阅读活动”的主力军。十八大报告第一次把“开展全民阅读活动”写入了党的工作报告中。图书馆生来就是提供阅读服务的,它的四大职能(保存、教育、信息、休闲)也主要是通过阅读来实现。它的阅读,包括老百姓的大众化阅读,以及为决策者和研究人员提供的专业性阅读服务。它通过阅读,也为社会的和谐稳定做出了贡献。很多人在其中寻找精神寄托,包括失业的,以及特殊人群。
据调查,目前国民阅读率大约是每年4.5本,而本市图书馆的持卡读者每年大约借阅图书近30本,凸显了图书馆的作用。
公共图书馆目前存在三方面的问题:
1、服务能级问题
上海市中心图书馆260多家分馆联网,全市有图书馆员2000多名,年流通量3700万册次,服务能力接近极限。但距离全市人民的要求还有距离。目前的办卡率8%,近200万读者,虽然全国第一,但还有提升空间。现在我们致力于数字阅读,希望实现转型发展。对上图而言最大的瓶颈在上图目前设施的老化和IT系统的陈旧,造成业务指标难有突破,阅读率难以提升。
2、可持续性问题
从长远看,体制制约和人才制约是两个绕不过去的坎。体制:目前仅仅从业务上的共建共享是不可持续的,行政体制上的总分馆制是行业的发展趋势,应可以逐步试点。
3、多元化服务问题。
作为研究型图书馆,必须提出更高的目标和要求,满足全市社会、经济、文化各方面各层次的情报需求,目前还只是满足共性的和大众化阅读的需求,研究型图书馆的功能还需要拓展。
一加拿大网络营销公司Capulet Communications预测今年(2013年)数字世界值得关注的六大趋势:
去年9月24日,美国图书馆协会当选主席Maureen Sullivan曾公开致信美国出版界,就出版行业在电子书方面拒绝向图书馆供货、或以完全不同于印刷图书的模式高价向图书馆售卖电子书、或附加很多其它限制的做法,进行了苛责。