创造永恒的商业动力
根据热力学,永恒运动不可能实现。但谁说物理定律一定适用于商业?如果应用得当,数据可以为您的组织带来能够自我维持、不断加速的动力。
为什么选择使用飞轮?
飞轮 - 正如作家 Jim Collins 所言,这是一个自我强化的循环,它由几个关键计划构成,这些计划相互补充并相互推动,从而使企业长盛不衰。90 年代初,Jeff Bezos 使用 Amazon 飞轮孕育了他创立 Amazon.com 的初步想法,Amazon 飞轮是一种经济引擎,它利用增长和规模通过更佳的选择和更低的成本来改善客户体验。
构建成功的数据飞轮
数据飞轮最独特的特性之一是没有“一件事”能为它单独提供动力,如果组织寻找的是此类解决方案,则可能会迷失方向。数据飞轮通过许多组件协同运转,使整体大于其各部分总和。如果组织花时间开发每个组件并在每个阶段实施最相关的技术和程序,将通过数据飞轮获得最大成功。
传统商用数据库
-
非常昂贵
传统数据库非常昂贵,您最终需要为过度预配置的容量支付更多费用。
-
专有和锁定
专有数据库功能会锁定您的应用程序并限制创新。
-
惩罚性许可
复杂的合同许可限制了灵活性并增加了不可预测的成本。
-
意外审计
频繁的审计可能会给部署增加意外的和计划外的成本。
-
重大的资本支出投资
本地部署资本支出没有尽头 - 如果硬件需要升级,您在预算方面就需承受压力。
客户正在转向开源数据库
由于传统商用数据库的挑战,客户正在尽可能快地转向开源替代数据库,如 MySQL、PostgreSQL 和 MariaDB。不过,他们还需要高端商用数据库的性能和可用性以及开源数据库的简单性和成本效益。
两全齐美
将其数据库迁移到 Amazon Aurora 的客户可以获得商用数据库的性能和可用性,以及开源数据库的简单性和成本效益。
不只是迁移数据,还要迁移工作负载
数据存储、数据仓库和数据库都位于云中。此外,可以通过将非关系数据库(如 MongoDB)、大数据处理工作负载(如 Hadoop 和 Spark)、运营分析工作负载(如 Elasticsearch)和实时分析工作负载(如 Kafka)迁移到云,来节省时间和降低成本。
关系数据库
从昂贵的 Oracle 和 SQL Server 数据库迁移到 Amazon Aurora。
非关系数据库
将键/值存储移至 Amazon DynamoDB,并将文档数据库(如 MongoDB)移至 Amazon DocumentDB。
数据仓库
从 Teradata、Oracle 和 SQL Server 数据仓库迁移到 Amazon Redshift。
Hadoop 和 Spark
将本地 Hadoop 和 Spark 部署移至 Amazon EMR 来节省时间和降低成本。
运营分析
可以将本地 Elasticsearch、Logstash 和 Kibana (ELK) 移至 Amazon Elasticsearch Service 来节省时间和降低成本。
实时分析
Apache Kafka 部署可以移至 Amazon Managed Streaming for Kafka,而 Amazon Kinesis 可以准备和分析数据流并将其加载到数据存储和分析工具中,让您能够立即使用。
为什么选择使用完全托管数据库?
数据库管理会成为您业务的主要负担。除了硬件和软件安装之外,您还必须考虑数据库配置、修补和备份。用于数据复制和高可用性的集群配置非常复杂,而用于计算和存储的容量规划和扩展集群冗长乏味。
完全托管的数据库可以提高生产力和效率
-
降低成本
完全托管的云数据库管理成本大大低于内部管理成本。
-
提高可用性
合适的云供应商可让您的数据库持续可用。
-
节省更多时间
减少了数据库管理任务,您的团队能够实现什么呢?
-
企业级可扩展性
如果在增长时不需要增加硬件或管理时间,那么即使是小型企业在扩大规模时也不用那么担心。
-
更大的潜力
轻松添加新服务,如数据仓库、内存数据存储、图形和时间序列数据库等。
存储和保留您所有的数据
在将您的数据移至云时,您不再需要担心决定要保留哪些数据以及丢弃哪些数据。利用多个用于热层和冷层数据的低成本的分层存储选项,您可以随时保留所需的所有数据并分析这些数据。
探索托管数据库和分层存储的成功案例
Autodesk 提高了数据库可扩展性并减少了复制延迟
Autodesk 已切换到 Amazon Aurora(一种与 MySQL 兼容的关系数据库)来提高数据库可扩展性并减少复制延迟。
应用程序设计的规则已发生改变
现代应用程序设计必须考虑社交、移动、物联网和全球访问。要让今天的应用程序提供最佳客户体验,它们需要具备超大存储容量、近实时访问速度和一流可扩展性的数据库。
今天的应用程序要求:
数据量:TB–PB–EB
所在地:全球
性能:毫秒-微秒
请求速率:百万
访问:Web、移动应用程序、物联网、设备
规模:扩大/缩小
经济性:按实际使用量付费
开发人员访问:即时 API 访问
存储和保留您所有的数据
-
更改数据库策略
将关系数据库用于解决所有问题的通用方法已不再可行。
-
分解复杂的应用程序
为了确保正确的架构和可扩展性,您需要检查每个应用程序组件。
-
构建高度分布式应用程序
将复杂的应用程序分解成微服务。
哪些数据库最适合您的工作负载?
适合某项工作的最佳工具通常因使用场景而异。这就是开发人员应使用大量专用数据库构建高度分布式应用程序的原因。探索以下最常见应用程序工作负载的优势和使用场景。
在关系数据库管理系统 (RDBMS) 中,数据以列和行的表格形式存储,并使用结构化查询语言 (SQL) 查询数据。表中的每一列表示一个属性,表中的每一行表示一条记录,表中的每个字段表示一个数据值。关系数据库之所以如此流行,是因为 1) SQL 易于学习和使用,无需了解基础架构 2) 可以修改数据库条目而无需指定整个表体。
优点
-
很好地处理结构化数据
-
支持 ACID 事务一致性并支持“联接”
-
内置数据完整性
-
数据准确性和一致性
-
该系统中的关系存在约束
-
无限索引
使用场景
-
ERP 应用程序
-
CRM
-
财务
-
事务
-
数据仓库
键/值数据库使用简单的键/值方法将数据存储为键/值对的集合,其中键充当唯一标识符。键和值可以是从简单对象到复杂的复合对象在内的任意项。它们非常适合需要即时扩展以满足不断增长或不可预测的工作负载的应用程序。
优点
-
简单的数据格式可以加快写入和读取
-
值可以是任何内容,包括 JSON、灵活架构等。
使用场景
-
实时出价
-
购物车
-
产品目录
-
客户偏好
在文档数据库中,数据存储在类似 JSON 的文档中,而 JSON 文档是数据库中的第一类对象。文档不是数据类型或值;它们是数据库的关键设计点。利用这些数据库,开发人员能够更轻松地使用他们在应用程序代码中使用的相同文档模型格式来存储和查询数据。
优点
-
灵活、半结构化和分层
-
数据库随着应用程序需求而发展
-
灵活架构
-
分层和半结构化数据的表示方法非常简单
-
强大的索引功能,便于快速查询
-
文档自然地映射到面向对象的编程
-
更易于将数据流式传输到持久层
-
针对文档构建的富有表现力的查询语言
-
跨文档的即席查询和聚合
使用场景
-
目录
-
内容管理系统
-
用户配置文件/个性化
-
移动
随着实时应用程序的兴起,内存中数据库越来越受欢迎。内存中数据库主要依靠主内存进行数据存储、管理和操作。内存中功能已在开源软件中作为内存缓存而普及,它可以通过缓存数据来加快动态数据库的速度,从而减少必须查询外部数据源的次数。
优点
-
延迟低于一毫秒
-
每秒可执行数百万个操作
-
与基于磁盘的方案相比,性能显著提高 3-4 倍或更高
-
更简单的指令集
-
支持丰富的命令集
-
适用于任何类型的数据库(关系数据库或非关系数据库)甚至存储服务
使用场景
-
缓存(50% 以上的使用场景会使用缓存)
-
会话存储
-
排行榜
-
地理空间应用程序(如约车服务)
-
发布/订阅
-
实时分析
图形数据库是 NoSQL 数据库,它使用图形结构执行语义查询。图形本质上是一个索引数据结构;它从不需要加载或访问与给定查询不相关的数据。在图形数据库中,数据以节点、边缘和属性的形式存储。
优点
-
能够频繁进行架构更改
-
能够管理海量的数据
-
实时查询响应时间
-
卓越的相关数据(无论大小)查询性能
-
满足更智能的数据激活要求
-
每个查询的显式语义 - 没有隐藏的假设
-
灵活的在线架构环境
使用场景
-
欺诈检测
-
社交网络
-
推荐引擎
-
知识图谱
时间序列数据库 (TSDB) 针对时间戳或时间序列数据进行了优化。时间序列数据与其他数据工作负载的差异很大,因为它通常以时间顺序形式到达,数据只能进行追加,并且查询总是在一个时间间隔内进行。
优点
-
非常适合随时间跟踪、监控和聚合的测量或事件
-
高可扩展性,可快速累积时间序列数据
-
对许多功能能够提供非常高的可用性,例如数据保留策略、连续查询和灵活的时间聚合
使用场景
-
开发运营
-
应用程序监视
-
工业遥测
-
IoT 应用程序
分类账数据库提供由中央可信权威机构拥有的透明的、不可变的且可进行加密验证的事务日志。许多组织使用类似分类账的功能构建应用程序,因为他们希望保留应用程序数据的准确历史记录。
优点
-
保留应用程序数据的准确历史记录
-
不可变且透明
-
可进行加密验证
-
高度可扩展
使用场景
-
财务 - 跟踪分类账数据,例如贷记和借记数据
-
制造 - 协调供应链系统之间的数据以跟踪完整的制造历史记录
-
保险 - 跟踪索赔事务历史记录
-
人力资源和工资单 - 跟踪和维护员工详细信息记录
了解云数据库成功案例
数据呈指数级增长
数据就像一头难以驯服的野兽。它呈指数级增长,来自新的来源且变得更加多样化,同时越来越难以处理。考虑到这一切,您的企业如何才能以保持竞争力所需的近乎实时的速度捕获、存储和分析其数据?
静态分析解决方案不起作用
-
孤立
由于数据受孤岛的限制,因此几乎不可能看到全局情况。
-
延迟
基于昨日数据的分析来得太晚,无法获得竞争优势。
-
昂贵
当分析平台的成本超过其见解的价值时,毫无意义。
-
仅关系型
要获得成功,您需要分析所有数据(关系和非关系)。
-
难以处理
如果没有人可以使用分析平台,那么它有什么用呢?
-
仅限于专家
制定更偏向数据驱动型的决策意味着使分析民主化。
使用数据湖改善您的分析
利用数据湖,您可以原始格式收集任何数据并将这些数据存储在一个集中的存储库中。它们提供最佳的规模、灵活性、持久性和可用性。但最重要的是,它们可以更快地分析您所有的数据并提供更明智的见解。
数据湖优化了许多类型的分析
从回顾性分析和报告到现代的实时处理再到预测,数据湖是任何类型的分析的理想选择。最常见的基于云的分析类型包括:
-
运营分析
分析侧重于改进现有操作,通常用于资源规划、系统操作和设备故障。
-
控制面板可视化
通过报告、控制面板和交互式图表,可以从高层次了解财务、营销、销售数据等。
-
快速交互式查询
查找并筛选静态数据,无需分析即可返回销售报告、营销计划、库存状态和其他结果。
-
大数据处理
处理庞大、复杂且多样化的数据集以利用点击流和日志分析或社交情绪。
-
实时流式处理
在存储传输中的流数据之前先分析该数据,以实现信用评分、欺诈检测、网络安全等。
-
明智的建议
机器学习算法会分析模式和趋势的数据,并支持下一个最佳产品/服务和人际网络等功能。
-
预测分析
数据分析和建模功能,可预测未来事件并提供“购买倾向”和“下一个可能的行动”见解。
为数据湖构建可靠论证
-
更多存储空间,更低成本
跨云数据库、数据仓库和数据湖的分层存储可让您以更少的成本存储更多的数据。
-
打破孤岛
将您所有的数据集中到一个高效的、易于访问的数据湖中。
-
分析您所有的数据
通过将您所有的数据集中到一个位置,可以生成更丰富、更准确的分析。
-
扩展数据类型
以任何格式存储结构化和非结构化的数据。
-
持久
Amazon S3 可达到 11 个 9(即 99.999999999%)的数据持久性,因为它会自动跨多个系统创建和存储您的数据。
ML 不只是炒作?
所有企业都可以使用云计算和机器学习 - 不再只是适用于大型科技公司和学术研究机构。云消除了使用 ML 进行实验和创新的障碍,因此,即使风险规避型企业也将其纳入自己的战略中。我们已达到一个临界点,最近,这些技术已从概念炒作转变为实际的业务影响。也许您不清楚如何开始机器学习,因此,我们提出了以下几个需要考虑的因素。
使机器学习成为数字化转型的核心
-
从数据战略开始
有效的 ML 需要干净、可访问的数据 - 因此,在开始之前,请务必将数据库整理好。
-
确定业务问题
通过考虑 ML 如何让客户满意、提高效率和生产力以及推动创新,来找到您的最佳使用场景。
-
尝试机器学习试点项目
以您的优先使用场景为重点来评估可行的试点项目,然后确定需要的工具、技能和预算。
使用 ML 开始创新
ML 有很多用途,但在本文中,我们希望您将其视为创新的驱动力。当您将分析输入到正确的 ML 系统时,它会提供建议和/或自动应用可改进流程的见解。这可为您的数据飞轮提供自我维持所需的强大内推力。
非炒作用途的区块链
区块链和(更广泛地说)分类账解决方案的能力才刚刚崭露头角,实际上,它们可以为许多不同的行业提供巨大的价值。目前,这些区块链网络和分类账应用程序正用于解决两类业务需求:跟踪并验证具有集中所有权的事务以及执行具有分散所有权的事务和合同。
区块链的真正需求
具有集中信任的分类账
创建一个由单个中央实体拥有的分类账是一项跨行业的需求,其中分类账充当一个透明的、不可变的且可进行加密验证的事务日志。然而,构建一个可扩展的分类账并不轻松:传统方法的特点是,资源密集型、难以管理和扩展、易出错且不完整、无法进行验证。解决方案不是区块链,而是一个集中的分类账。利用 Amazon QLDB,您可以将此使用场景与专用的分类账数据库结合使用,以实现在企业使用过程中所需的透明度、安全性、不变性和速度。
具有分散信任的事务
当您需要跨多个实体快速执行事务,而不需要可信的中央权威机构时,区块链很有吸引力。但是,现有框架难以设置、难以扩展、管理复杂且操作成本非常高。区块链网络中的每个成员必须手动配置硬件、安装软件、创建和管理访问控制证书以及配置网络组件。一旦区块链网络运行起来,用户就必须不断地监视基础设施并适应各种变化。Amazon Managed Blockchain 可以帮助您克服这些挑战,并开始利用随着使用量的增长而扩展的区块链,提高可靠性并增强持久性。