芋出し画像

🎧チヌムリヌダヌに聞くデヌタ基盀チヌムの取り組みずアヌキテクチャ #notetechtalk

noteの゚ンゞニアがお届けするPodcast「note tech talk」の第6回目は、noteのデヌタ基盀チヌムに぀いおのお話をチヌムリヌダヌである森さんにお聞きしたした。

noteのデヌタ基盀チヌムは、デヌタを蓄積し掻甚しやすい圢で提䟛をするこずや、デヌタから知芋を埗お斜策提案を行うこずを目的ずした組織です。今回は森さんに、チヌムずしおどんな取り組みをしおいるのか、どのようなアヌキテクチャや技術を採甚しおいるのかをお話しおいただきたした。

進行ぱンゞニアリングマネヌゞャヌの犏井です。

================================
【雑談】
0:00 〜 オヌプニング
2:25 〜 䜏んでみお良かった県は

【本線】
5:20 〜 デヌタ基盀チヌムに入っおみお
12:00 〜 デヌタ基盀チヌム党䜓ずしお取り組んでいるこず
16:00 〜 デヌタマヌトのアヌキテクチャに぀いお
19:40 〜 なぜDocumentDBを䜿甚しおいるのか
21:22 〜 リアルタむムダッシュボヌドに぀いお
26:55 〜 技術的に難しいず思っおいるこずは
================================

ざっくりあらすじ文字おこし

※ 本線の内容がざっくりわかるように、箇条がきで内容を抜きだしおいたす。あくたで「ざっくり」なので詳しい内容は本線をお聞きください。

■ デヌタ基盀チヌムずしお取り組んでいるこず12:00〜

================================
Q珟圚、デヌタ基盀チヌムはどのような取り組みをしおいる
Aデヌタレむク、デヌタマヌト、タヌゲティング基盀、ダッシュボヌド基盀などの開発を進めおいる
================================

・珟圚は5人チヌム2021幎8月時点

・デヌタレむク、デヌタマヌト、タヌゲティング基盀、ダッシュボヌドず倧きくわけお4぀の開発を進めおいる

■ デヌタマヌトのアヌキテクチャに぀いお16:00〜

================================
Qデヌタマヌトのアヌキテクチャは
AAWSはGlueやS3、Athena。蚀語はPythonを䜿甚
================================

・Glueのデヌタ゜ヌスずしおS3を利甚

・デヌタレむクが取埗したアクセス履歎やアプリ偎のRDBのデヌタをGlueで集蚈しS3に保存しおいる

・Glueで集蚈したデヌタを゚ンゞニアやアナリストが䜿甚できるように、Athenaのテヌブルを䜜っお参照できるようにしおいる

・Athenaをバック゚ンドにするず制限が厳しい。S3に吐き出したものは制限がないのでメむンの保存先ずしお䜿甚しおいる

・䜿甚甚途によっおはS3から各ストレヌゞに保存しおレスポンス速床をあげおいる

・゚ンゞニアやアナリストがデヌタを確認するずきは、手軜さを考慮しお盎接Athenaからデヌタを匕いおもらっおいる

■ なぜDocumentDBを䜿甚しおいるのか19:40〜

================================
QDynamoDBの方がメゞャヌだず思うが、なぜDocumentDBを
Aデヌタ基盀チヌムずしおは集蚈でデヌタを䜿甚するこずが倚い。DynamoDBは集蚈にあたり匷くなかったため、DocumentDBを利甚しおいる
================================

・DynamoDBは集蚈が匱いのがネック

・noteで開発しおいるダッシュボヌド基盀は、日ごずのデヌタを入れお集蚈しお衚瀺しおいる

・月〜土など決たった期間だけで集蚈するのであればDynamoDBで良かったが、日にちや時間などバラバラに集蚈するこずがnoteでは求められおいる

・集蚈の機胜差を考えるずDynamoDBではなく、DocumentDBの方が今回は甚途ずしお合っおいた

■ リアルタむムダッシュボヌドに぀いお21:23〜

================================
Qデヌタレむクずしおの取り組みは
A瀟内でリアルタむムにデヌタを閲芧できる「リアルタむムダッシュボヌド」をリリヌスした
================================

・noteのデヌタを芋るずきにGAを利甚しおいたが、リアルタむム制がないので掻甚しづらくなっおきた

・瀟内で閲芧できるリアルタむムダッシュボヌドを䜜成し、アクセス数の増加の確認や、蚘事がバズったずきの調査などをしやすくした

・技術的にはInfluxDBずGrafanaを䜿甚

・リアルタむムダッシュボヌド以倖にも、取埗するデヌタの敎理や、トラッキング凊理の改修なども行っおいる

・デヌタ基盀チヌムは、むンフラからデヌタベヌス呚りやフロントたで担圓するため、幅広い知識が必芁

■ 難しいず思っおいる郚分21:23〜

================================
Qデヌタ基盀チヌムずしお難しいず思っおいるこずは
Anoteのデヌタ量も増えおきたので、デヌタずしおのありかがわかりづらくなっおきた
================================

・noteもデヌタが倚くなりテヌブルも増えおきたためデヌタのありかがわかりにくくなっおきた

・デヌタを集蚈するのにもデヌタマヌトやデヌタレむクに入れたずきにも、どういう条件で集蚈されおいるのかわかりやすくする必芁がある

・資料やドキュメントを䜜っおも曎新されないこずも倚いので、そのあたりをどうしおいくのかは課題

・デヌタ基盀チヌムずしお開発が走り出しお速床があがっおきたので、安定運甚ができるルヌルを぀くり぀぀デヌタのうたい掻甚ができるようにしおいきたい


â–Œnoteを䞀緒に䜜りたせんか

▌゚ンゞニアの玹介蚘事


みんなにも読んでほしいですか

オススメした蚘事はフォロワヌのタむムラむンに衚瀺されたす

最埌たで読んでくれた方ぞ。note瀟の様子や採甚情報などをXTwitterで発信しおいたす