\r\n\r\n
RDBMSとHadoopの大きな違いは、RDBMSは構造化されたデータを保存するのに対し、Hadoopは構造化、半構造化、非構造化データを保存する点です。
リレーショナルデータベース管理システムとは、リレーショナルモデルに基づいてデータベースを管理するシステム。
1. 概要と主な違い 2. RDBMSとは 3. Hadoopとは 4. 横並び比較 - RDBMSとHadoopを表形式で 5. まとめ
RDBMSは、リレーショナルモデルに基づくデータベース管理システムである。RDBMSでは、データを格納するためにテーブルが使用され、キーとインデックスがテーブル間の接続に役立つ。テーブルはデータ要素の集合体であり、エンティティである。行と列が含まれています。行はテーブルの個々のエントリーを表しています。列は属性を表す。
例えば、販売データベースには、顧客と製品の両方のエンティティを含めることができます。顧客は顧客ID、名前、住所、電話番号などの属性を持ち、品目は製品ID、名前などの属性を持つ。顧客テーブルの主キーは顧客ID、製品テーブルの主キーは製品IDであり、製品IDは顧客テーブルの外部キーとして置かれ、この二つのエンティティを接続する。繰り返しになりますが、これらの表は相互に関連しています。データの整合性、正規化などを提供する。リレーショナルデータベースには、MySQL、MSSQL、Oracleなどがあり、これらはクエリにSQLを使用する。
Hadoopは、Javaで書かれたApacheのオープンソースフレームワークである。Hadoop の主な目的は、大量の複雑なデータであるビッグデータの保存と処理です。Hadoop のスループットは高く、一定時間内に大量のデータを処理する能力を指します。
Hadoopのアーキテクチャには、4つのモジュールがあります。それらはhadoopcommon、YARN、Hadoop Distributed File System (HDFS)、hadoopmapreduceです。commonモジュールにはJavaのライブラリとユーティリティが含まれています。また、Hadoopを起動するためのファイルも備えています。hadoopyarnは、ジョブのスケジューリングとクラスタリソースの管理を行います。
また、Hadoopのストレージシステムとして、HDFS(Hadoop Distributed File System)があります。マスター・スレーブ・アーキテクチャを採用しています。マスターノードは、ファイルシステムのメタデータを管理するNameNodeである。他のコンピュータは、スレーブノードまたはデータノードである。実際のデータを保存するのである。一方、hadoopmapreduceは分散計算を行う。データを処理するためのアルゴリズムを持っています。HDFSでは、マスターノードにジョブトラッカーがあります。スレーブノードでmap reduceジョブを実行します。各スレーブノードには、データ処理を完了し、結果をマスターノードに送り返すためのジョブトラッカーが搭載されている。全体として、Hadoopは大量のデータストレージを高い処理能力で提供します。
RDBMSとHadoop | |
リレーショナルデータベース管理システムとは、リレーショナルモデルに基づいてデータベースを作成・管理するシステムソフトウェアである。 | Hadoopは、多くのコンピュータを接続し、大量のデータと計算を伴う問題を解決するためのオープンソースソフトウェアの集合体である。 |
データの多様性 | |
RDBMSは構造化されたデータを保存する。 | Hadoopは、構造化、半構造化、非構造化データを保存します。 |
データ保存 | |
RDBMSは平均的なデータ量を保存します。 | Hadoopは、RDBMSよりも多くのデータを保存することができます。 |
スピード | |
RDBMSでは、読み込みは高速に行われます。 | Hadoopでは、読み込みも書き込みも高速です。 |
スケーラビリティ | |
RDBMSは垂直方向に拡張可能である。 | Hadoopは水平方向のスケーラビリティがあります。 |
ハードウェア | |
RDBMSはハイエンドのサーバーを使用しています。 | Hadoopは共通のハードウェアを使用します。 |
スループット | |
RDBMSのスループットを向上させる。 | Hadoopのスループットが低い。 |
RDBMSとHadoopの主な違いは、RDBMSは構造化データを保存するのに対し、Hadoopは構造化、半構造化、非構造化データを保存する点である。
1.チュートリアルポイント"SQL RDBMSの概念" チュートリアル・ポイント、2018年1月8日。こちらから入手可能 2.チュートリアル・ポイント. "Hadoopチュートリアル", チュートリアル・ポイント, 2018年1月8日.こちらで入手可能です 2.チュートリアルポイント"Hadoopチュートリアル"。