我们都知道一句话“巧妇难为无米之炊”,数据源就是让数据产生价值中的那些大米。那大数据时代企业需要哪些数据呢?根据我个人理解我觉得可以大致分为以下几类:
1、(内部)企业自身业务生产经营环节产生的内部数据,包括销售、客服、仓储、财务等;
2、(运营)可以理解为企业发展过程中掌握在第三方手中的数据,如企业的广告供应商以及一些传播与媒体数据,新媒体、H5、app等;
3、(外部)包括传统调研数据和机器数据,搜索、电商、社交等。而对于外部数据的获取上,企业往往会觉得有难度,这时候就可以借助API供应商的力量来补充自己的数据源。
先来科普个概念,开放应用程序的API(即Application Program Interface,应用程序接口)可以让开发者在无需访问源码,或理解内部工作机制细节的情况下,调用他人共享的功能和资源。在数据源的获取上API是个好伙伴。本文将介绍7款API供应平台:百度APIStore、Apix、数说聚合、通联数据、HaoService、聚合数据、datasift (排名不分先后)。
一、功能对比
二、详细介绍
1、百度API Store
百度旗下的API Store,能够满足大部分个人应用开发者,特别是其最近推出的Android和IOS SDK。其接口分类较细,但是感觉有一些分类之间存在交集,没有明显的边界区分。接口、数据更新速度也比较快,支持个人发布与定制化服务,上千的接口量基本可以满足一般开发者的需求。提供移动开发SDK,移动开发者可调用API Store服务所开发的SDK包,加上API文档清晰明了,上手简单。
缺点就是由于接口杂乱繁多且来源不一,部分接口的质量、稳定性没有保证。
2、Apix
Apix更多是面向小贷机构、互联网金融、租赁保理等行业客户,除了提供身份核验、工商信息、失信名单、支付缴费等接口,还有包括电商、学历信息、运营商记录、信用卡账单等分析服务。其数据分类包括征信风控、支付缴费和常用数据,而征信风投是其主打数据。由于这类数据具有专业性,因此收费相比其他API会稍微偏高。
接口大多数是Apix自主开发,质量有保证,部分核查接口的高级版还能联网检测,就是接口的数量确实有点少。
3、聚合数据
聚合数据跟百度的APIStore有点像,接口包括生活、旅游、金融、开发、咨询等分类,还比较全面,更加适合对接口质量和稳定性有较高要求的公司或企业级应用的开发者。但是并不支持个人发布,因此接口的质量和稳定性会比较好,但也正因为这样接口量大大减少。
聚合数据给我的感觉更像是致力于打造高质量API,不求广而求精。不过申请使用接口需要实名认证和审核,算是双刃剑吧,对于买卖双方来说是一个保障,但是对于试用者来说是一个不太好的体验。
4、HaoService
Haoservice近期更新后推出了源码商城,用户可在上面直接购买商城、管理系统、UDP通讯源、发布系统等源码。总体来说比较适合公司或企业级应用的开发者。其主打生活服务类接口,主推基站、定位、地址解析、坐标服务等API,目前仅支持企业用户发布接口,因此接口的质量和稳定性有保障,但接口数量也是一个痛点。VIP级别以上用户可进行个性化定制,且有专人24小时技术支持,服务到位。
5、通联数据
通联数据提供行情、沪深股市/期权、债券、基金、咨询、研究报告等API,适合金融类应用和金融咨询网站、平台的开发者,以及从事金融行业的分析、业务人员。通联数据主要做金融大数据,上千的数据接口可以满足金融行业的大部分需求。
数据有API和研报两种格式,接口来源于自主研发或恒生聚源、九次方大数据、华通人、朝阳永续、中诚信资讯、巨灵财经等企业。
6、数说聚合
数说聚合跟上面的数据API不同,面向的客户不只是大数据应用开发者,对互联网数据有强烈需求的各行业分析师、业务人员、运营人员同样可以通过数说聚合拿到你们想要的数据。数据覆盖范围广泛,包括国内社交、新闻、电商、互联网垂直领域等多平台多维度的数据。用户可以通过接口调用、文件下载等方式获取数据。接口完全自主研发,质量、稳定性十分有保障,且支持个性化定制。
不过目前只面向企业用户,个人用户想要使用可能还需要一段时间。
7、Datasift
Datasift的性质与数说聚合相似,其数据基本覆盖国外主流网站,包括Facebook、Tumblr、Google+、YouTube、Instagram等,且提供数据分析服务。来源于国外站点的数据质量较好,不过可能是服务器在国外的原因,响应会有明显的延迟;而国内站点数据的话,小编曾经在datasift购买微博数据(当时在国外无法通过国内公司购买微博的数据),数据质量只能说一般。
其业务目前暂未向国内市场开放,只能通过特殊途径购买。
以上是国内外比较知名的数据API产品,基础性的可能更多会选择百度APIStore、聚合数据、Haoservice;而对于行业、专业有特别需求的用户来说,通联数据、Apix会使不错的选择;如果是需求国内社交、电商、资讯平台的数据,可以考虑数说聚合;如果是要国外数据,小编则比较推荐Datasift。读者可根据自身的需求,选择最适合的API。