讲解员:大数据

大数据是一个术语,用来描述大型和复杂的数据集,通过有意义的方式分析和可视化,可以提供深刻的结论。传统的数据库工具不具备管理大量非结构化数据的能力。

大数据通常被定义为一组庞大而复杂的数据集,这些数据集很难使用现有的数据库管理工具或传统的数据处理应用程序进行处理。关系数据库管理系统和桌面统计和可视化软件包在处理大数据时经常遇到困难。相反,这项工作需要在数十台、数百台甚至数千台服务器上运行“大规模并行”软件。大数据必须使用先进的分析工具和算法来处理,以揭示有意义的信息。

在过去的五年中,新的互联网和生物识别技术已经出现,它们能够将来自不同信息源的数据组合到一个统一的位置,以便对数据进行分析。

大数据通常包含的数据集的大小超出了常用软件工具在可容忍的时间内捕获、整理、管理和处理数据的能力。大数据的“大小”从几十兆兆字节到许多拍字节不等。大数据通常被描述为一组技术和技术,这些技术和技术需要新的集成形式,以从多样化、复杂和大规模的大数据集中发现巨大的隐藏价值。

大数据涉及的过程包括:分析、捕获、数据管理、搜索、共享、存储、传输、可视化和信息隐私。这个术语通常仅指使用预测分析或其他特定的高级方法从数据中提取值,很少用于特定大小的数据集。大数据的准确性可能会让决策更加自信。对企业和政府来说,更好的决策意味着更高的运营效率、降低成本和降低风险。

数据集的规模之所以不断扩大,是因为越来越多的廉价信息传感移动和遥感设备、软件日志、照相机、麦克风、射频识别(RFID)阅读器、无线传感器网络、生物识别设备和数据库正在收集这些数据。自上世纪80年代以来,全球人均存储信息的技术能力大约每40个月就翻一番。大企业面临的挑战是,决定由谁来运营贯穿整个企业的大数据计划。

对数据集的分析可以发现新的关联,允许用户发现商业趋势,预防疾病,打击犯罪和恐怖主义,以及其他数据密集型应用程序。科学家、企业高管、媒体、广告商和政府都经常在互联网搜索、金融、商业信息学、国家安全和治安等领域遇到大量数据集的困难。科学家在研究气象学、基因组学、连接组学、复杂物理模拟以及生物和环境研究时遇到技术限制。

大数据系统的目的是让这些参与者更容易找到相关性,以帮助他们解决问题。大数据通常以容量、多样性、速度、可变性、准确性和复杂性来衡量。大数据系统通常利用高级数据中心内基于云的服务器,而不是集中的大型机处理器。

文章主题

||

最新的生物识别金宝搏App钱显示错误技术新闻

评论

3对“解释者:大数据”的回答

留下一个回复

这个网站使用Akismet来减少垃圾邮件。了解如何处理您的评论数据

本周阅读次数最多

公司的特色

生物识别技术研究

生物识别技术白皮书

生物识别事件

解释生物识别技术

Baidu