PgDogが資金調達を完了し、あらゆる環境に対応するデータベースソリューションを提供
本記事は、PostgreSQLの拡張スケーラビリティの問題を解決することを目指すスタートアップ「PgDog」に関する発表です。PgDogは、既存のNoSQLデータベース(例:MongoやDynamo)が存在する理由の一つであるPostgresのスケールアウト課題に対応するため開発されました。彼らは、従来のPostgresにプロキシ層を追加することで、水平スケーラビリティを実現した製品を構築しました。
現在、PgDogは本番環境において20TB以上のデータをシャーディングし、毎秒200万件を超えるクエリを処理している実績があります。このソリューションはオープンソースであり、GitHubで140万回以上のDockerプル数を記録するなど、高い採用実績を示しています。
利用方法として、ユーザーは独自のクラウド環境やオンプレミス環境にPgDogのDockerイメージをデプロイするだけで利用可能です。開発チームは、自身がインフラストラクチャエンジニアであることを強調し、過去にInstacartなどの大規模なサービスでPostgresを運用・スケールさせた経験に基づき、この技術を確立したと述べています。
PgDogの創設者の一人であるLev氏によると、彼らの目標は「Postgresがあらゆる規模で機能すること」であり、その実現のために本製品を開発しました。資金調達にはBasis Set、YC、Pioneer Fundなどから合計550万ドル(約8億円超)を獲得し、長期的な事業継続性を確保しています。今後はAWSでの利用を容易にするエンタープライズ版の提供も計画されており、Postgresの採用増加に伴い市場が拡大すると予測されています。
背景
近年、データ量の爆発的な増加とリアルタイム処理の要求により、従来の単一データベースシステムでは対応しきれない「スケーラビリティ」の問題が深刻化しています。特にPostgreSQLのような強力なリレーショナルデータベースを大規模環境で運用する際、水平方向への拡張(スケールアウト)が大きな課題となっていました。
重要用語解説
- PgDog: PostgreSQLの前に配置されるプロキシレイヤーを持つオープンソースのデータソリューション。従来のPostgresの限界を超えるため、データを複数のノードに分散させ(シャーディング)、高いスケーラビリティを実現します。
- 水平スケーラビリティ (Horizontal Scalability): システム全体の処理能力を向上させるために、単一のマシンではなく、多数のサーバーやリソースを追加していく拡張性。データ量が増大する現代において必須の概念です。
- シャーディング (Sharding): 巨大なデータベースを複数の小さな単位(シャード)に分割し、それぞれ異なるサーバーで管理すること。これにより、単一サーバーの処理能力を超える大規模なデータ処理が可能になります。
今後の影響
PgDogのようなソリューションが普及することで、企業はPostgreSQLという信頼性の高いRDBを維持したまま、NoSQLデータベースと同等以上の超大規模なトラフィックとデータ量に対応できるようになります。これは、特に金融やEコマースなど、データの整合性が求められる分野のシステム設計に大きな変革をもたらすことが予想されます。