このチュートリアルでは、ビッグ データ ファイル共有を作成するためにデータを設定する手順を、順を追って説明します。ビッグ データ ファイル共有は、ポータルに作成されるアイテムであり、GeoAnalytics Server が利用可能な場所にあるフィーチャ データ (テーブル、ポイント、ポリライン、ポリゴン) を参照します。ポータルにあるビッグ データ ファイル共有アイテムを使用すると、データセットに対して GeoAnalytics ツールを実行できるように、登録済みのデータを参照して選択できます。ビッグ データ ファイル共有の作成後は、[ポイントの集約] ツールを使用してデータを利用します。このチュートリアルでは、タクシーの下車場所と乗車場所のデータセットをダウンロードし、GeoAnalytics ツール を使用して下車が最も頻繁に行われている場所を特定します。
前提条件
ArcGIS Enterprise 管理者が GeoAnalytics Server を構成していることを確認します。GeoAnalytics Server にアクセスできるよう、管理者から ArcGIS Server Manager の URL を入手してください。詳細については、ArcGIS GeoAnalytics Server の設定をご参照ください。
データの準備
ここで示す例で使用されるデータをダウンロードして準備するには、次の 2 つのステップを実行します。
- 「BigDataExample」という名前のフォルダーを、GeoAnalytics Server が利用可能な場所に作成します。BigDataExample フォルダー内に、「NYCTaxi」という名前のフォルダーを作成します。
- http://www.nyc.gov/html/tlc/html/about/trip_record_data.shtml にアクセスして、2014 年 1 月と 2 月の黄色 (Yellow) のタクシー データを BigDataExample > NYCTaxi フォルダーにダウンロードします。
ビッグ データ ファイル共有の作成
すべての GeoAnalytics Server コンピューターがアクセス可能な場所にデータを保存したら、GeoAnalytics Server Manager を使用して、そのデータをビッグ データ ファイル共有として GeoAnalytics Server に登録します。ビッグ データ ファイル共有を作成すると、GeoAnalytics Server ツールで利用できるビッグ データ カタログ サービスが作成されます。ビッグ データ ファイル共有を作成するには、次の手順を実行します。
- GeoAnalytics Server Manager にサイン インします。URL の形式は https://gisserver.domain.com:6443/arcgis/manager です。この URL がわからない場合、管理者にリクエストしてください。
- [サイト] > [データ ストア] の順にクリックして、[ビッグ データ ファイル共有の登録] を選択します。
- [ファイル共有] タイプのデフォルト値をそのまま使用し、一意の名前とフォルダー BigDataExample へのパスを入力して (Windows の場合は \\sharedLocation\BigDataExample、Linux の場合は /sharedLocation/BigDataExample など)、[作成] をクリックします。ビッグ データ ファイル共有のデータ ストアが作成されます。このデータ ストアは、ポータルのビッグ データ ファイル共有アイテムに対応し、https://gisserver.domain.com:6443/arcgis/rest/services/DataStoreCatalogs/bigDataFileShares_FileShareName/BigDataCatalogServer 形式の URL (FileShareName は、登録時にデータ ストアに指定した名前によって決定される) を介して使用可能なビッグ データ カタログ サービスに基づいています。この例では、ビッグ データ ファイル共有にデータセット [NYCTaxi] があります。これはビッグ データ ファイル共有のフォルダーにちなんで名づけられたものです。
ビッグ データ ファイル共有の編集
このデータセットには複数の日付/時間フィールドが含まれています。マニフェストに含まれるデータセットを調べて、正しいフィールドを使用していることを確認します。マニフェストに含まれるデータセットを表示および編集するには、ArcGIS Server Manager でビッグ データ ファイル共有の横にある鉛筆アイコンをクリックします。マニフェストが最初に生成されたとき、geometry と time パラメーターは乗車場所を使用します。乗車場所のフィールドは、マニフェスト生成プロセスによって選択されます。このチュートリアルでは、下車場所の解析を実行します。
メモ:
マニフェストが生成されると、ジオメトリと時間を表すためのフィールドを見つけるよう、最適な推定値が適用されます。
このチュートリアルでは、下車時間と下車場所を使用するようにマニフェストを変更します。つまり、解析によって乗車場所ではなく下車場所が集約されるということです。解析では、いずれかのジオメトリ (乗車または下車) を使用できます。適切なジオメトリは、解決しようとしているものによって異なります。これらの変更を行うには、ビッグ データ ファイル共有データセット エディターを使用します。
メモ:
また、この操作は、マニフェストをダウンロードして編集し、編集後のマニフェストをアップロードすることによっても完了できます。マニフェスト自体の編集の詳細については、「ビッグ データ ファイル共有のマニフェストについて」をご参照ください。
- ビッグ データ ファイル共有のマニフェストが生成された後にそのマニフェストを編集するには、ビッグ データ ファイル共有の横にある鉛筆ボタンを選択します。
- [データセット] の下の [NYC Taxi] データセットを選択します。
- [ジオメトリ] セクションは、現在 X および Y の値を表すために使用されているフィールドが pickup_longitude と pickup_latitude であることを示しています。[X 値を表示するフィールド] の値を pickup_longitude から dropoff_longitude に変更します。[Y 値を表示するフィールド] の値を pickup_latitude から dropoff_latitude に変更します。
- [時間] セクションは、現在時間値を表すために使用されているフィールドが、yyyy-MM-dd HH:mm:ss 形式の pickup_datetime であることを示しています。時間フィールドを pickup_datetime から dropoff_datetime に変更します。
- [保存] ボタンをクリックして、ビッグ データ ファイル共有の変更を保存します。
Portal for ArcGIS を使用したタクシー データに対する解析の実行
データが GeoAnalytics Server に登録され、ビッグ データ ファイル共有アイテムがポータルに作成された後は、そのアイテムを参照して選択し、アイテムに対して GeoAnalytics Server ツールを実行できます。
メモ:
GeoAnalytics Server に登録されているデータはご使用のサーバーにアップロードされていません。このデータは GeoAnalytics Server に登録されているだけであり、スキーマを定義するマニフェストを使用します。
- ポータルにログインします。URL の形式は https://webadaptorhost.domain.com/arcgis/home です、ここで、arcgis はポータルに登録されている ArcGIS Web Adaptor の名前です。[コンテンツ] に移動します。[コンテンツ] テーブルに、作成したビッグ データ ファイル共有アイテムが表示されます。
- [マップ] をクリックして Map Viewer に移動します。
- [解析] ボタンをクリックします。フィーチャ解析とラスター解析の両方が利用可能な場合は、[フィーチャ解析] をクリックしてから、[GeoAnalytics ツール] > [データの集約] > [ポイントの集約] の順にクリックします。
- 検索バーに「New York」と入力して、[検索] をクリックします。マップは、ニューヨーク市の範囲にズームします。
- [ポイントの集約] ツールを実行すると、指定したサイズのポリゴンまたはビンにポイントを集約することで、データへの理解を深めることができます。ここでは、集約先となるポリゴン データセットがないため、空間と時間の両面でビンに集約します。集約先のレイヤーとして「New York City taxi cab」データセットを追加するには、最初のツール パラメーターとして [解析レイヤーの選択] を選択します。表示されるダイアログ ボックスで、[コンテンツ] を選択して、「New York City taxi cab」データセットを参照して選択します。レイヤーを選択して [レイヤーの追加] をクリックします。
- サイズが 1 キロメートルの四角形のビンに集約します。
- データは時間対応であるため、時間ステップを適用できます。データのダウンロードから、2 か月分のデータが存在することがわかっています。このチュートリアルでは、各月の第 1 週目を調査します。これには、[時間間隔] を [1 週間]、[時間ステップの繰り返し頻度] を [1 か月]、[時間ステップを調整する時間] を [2017 年 1 月 1 日 12:00 AM] に設定します。テスト データは 2014 年用ですが、[ポイントの集約] は、解析の時間を前方および後方の両方に調整する機能を提供します。
- 興味を引く統計情報を選択します。いくつか例を挙げると、total_amount の [平均値] や Trip Distance の [分散] などがあります。
- 空間参照をニューヨーク市のローカル投影法に設定します。歯車ボタンをクリックし、解析設定にアクセスします。[処理に使用する座標系] では [値指定] を選択してグローブを選択し、[空間参照] → [PCS] → [UTM WGS 1984 UTM Zone 18 N] の順にクリックし、[OK] → [適用] の順に選択することで、UTM ゾーン 18N を参照します。ニューヨーク市の地域にズームし、[現在のマップ範囲を使用] がオンになっていることを確認し、解析を実行します。この解析は、GeoAnalytics Server に属するコンピューター上で実行されます。解析が完了した時点で、結果がマップに追加されます。結果として、各ポリゴン内でタクシーの下車場所を表現する矩形ポリゴンに加え、計算した追加の統計情報が提供されます。結果には、約 3,500 ~ 4,000 のフィーチャが含まれています。結果は、画面上のマップの範囲とタイム ゾーンによって異なります。