CLOSED BETA 開発中

個人で作ったAgent Skillsを、
組織で安全に使える社内AIサービスへ。

閉域環境での構築から、品質ゲート・監査レポート・承認フローまで一体で。

Celsius は、Claude Code の Skill(ワークフロー定義)をもとに、
非エンジニアにも安全に届く社内AIサービスを閉域・ローカルLLM環境で立ち上げ、
公開前の品質保証・監査・承認までを一体で回せる基盤です。

AI導入の次のボトルネックは「品質保証」

ソフトウェアテストには JSTQB / ISTQB の長年の蓄積がある。

しかし生成AI・エージェントは、確率的推論・外部ツール利用・長文脈・自律実行が絡み、従来のテストだけでは足りない。

いま現場では、以下のような手法が個別に使われ始めている。

Metamorphic Testing LLM-as-a-Judge Red Teaming Golden Dataset Memory Test

だが、現場で回る一体型の品質保証UX はまだない。

References
OWASP AI Testing Guide — AI testing を security 単体ではなく trustworthiness testing と位置づけている。
OWASP LLM Top 10 2025 — Prompt Injection など AIアプリ固有のリスクを整理している。
NIST AI RMF — Govern / Map / Measure / Manage の4機能を提示している。
Key Insight

これから必要なのは

Build more → ではなく

Test, Govern, Trust

なぜ今、この基盤が必要なのか。

個人のAI活用は加速している。しかし、それを組織で安全に展開するフェーズで多くの企業が止まっている。

01

個人のAI活用は進むが、
組織展開で止まる

エンジニア個人が Claude Code で作った便利なワークフローも、チーム全体に広げる仕組みがない。属人化したまま放置される。

02

Skills や .md 配布では
スケールしない

ファイルを共有するだけでは、非エンジニアは使えない。バージョン管理も品質担保もできず、野良AIが増えていく。

03

品質保証なしでは
社内公開が通らない

社内AIサービスを立ち上げても、品質が担保されていなければ情シスや経営層の承認は通らない。

04

構築から承認まで
一体の基盤がない

サービス生成、テスト、監査、承認を別々のツールで回すと工数が膨らみ、導入が頓挫する。

Celsius ができること。

Agent Skills の取り込みから、社内公開・運用まで。4つのステップを一体で回します。

01
Build

Skills / Repo を取り込む

Claude Code Skills、リポジトリ、プロンプト定義を取り込み、非エンジニアが使える Webアプリとして自動構成。ローカルLLM にも対応。

02
Deploy

閉域環境で立ち上げる

オンプレミス・VPN・閉域クラウドなど、企業ポリシーに合わせた環境で社内AIサービスとしてデプロイ。

03
Test & Govern

品質ゲートと監査レポート

自動テスト・品質スコアリング・監査レポートを生成。社内承認を通すための証跡を整備。

04
Release

承認を経て公開・運用

承認フローを通過したサービスのみ社内公開。運用中の再テスト・バージョン管理も継続。

Build → Test → Govern → Release

Claude Code Skills から社内公開までの一貫フロー。
技術詳細は商談でご説明します。

Build
  • Agent Skills 取込
  • リポジトリ連携
  • Webアプリ自動構成
  • ローカルLLM接続
Deploy
  • 閉域環境デプロイ
  • オンプレ / VPN対応
  • 権限・アクセス制御
  • 非エンジニアUI提供
Govern
  • 品質評価レイヤ
  • 監査レポート生成
  • テストハーネス実行
  • ログ / 証跡記録
Release
  • 承認フロー
  • 公開判定
  • バージョン管理
  • 再テスト・再承認

代表ユースケース

Claude Code で作った Skills を、こんな社内AIサービスへ変換できます。

USE CASE 01

ナレッジ検索

情報セキュリティポリシーや社内規程・マニュアル・FAQをAIが横断検索。必要な情報を即座に引き出し、新人オンボーディングやヘルプデスク対応を効率化。

USE CASE 02

人事・採用

職務経歴書のレビューや求人要件との適合度チェックをAIがサポート。採用プロセスの初期スクリーニングを効率化し、人事担当者の判断を支援。

USE CASE 03

法務・契約書チェック

契約書のリスク条項や不備をAIが事前チェック。過去の契約テンプレートとの差分比較や条文の要約で、法務レビューの工数を削減。

USE CASE 04

経理・経費精算

領収書の読み取りや勘定科目の自動判定、経費規程との照合をAIが代行。承認フロー付きで人間が最終判断する設計を維持。

USE CASE 05

分析業務・データ集計

売上データや業務KPIの集計・可視化をAIがサポート。自然言語での問い合わせでレポートを生成し、データドリブンな意思決定を加速。

品質ゲート・監査・承認の詳細

「作って終わり」にしない。社内承認を通しやすくする証跡とレポートを自動で整備します。

品質ゲート

機能テスト・セキュリティチェック・パフォーマンス評価を自動実行。基準未達のサービスは公開ステップへ進めない。

監査レポート

テスト結果・品質スコア・使用モデル・入出力サンプルを構造化レポートとして出力。経営層・情シスへの説明資料に。

承認フロー

レポートに基づく承認 / 差し戻しフロー。誰が・いつ・何を承認したかの証跡を全件記録。

ログ / 証跡

サービス生成から運用まで、すべての操作・判定・変更履歴を記録。内部監査や第三者監査にも対応可能な証跡基盤。

再テスト

サービス更新時やモデル変更時に再テストを自動トリガー。品質の継続的な担保を仕組み化。

公開前レビュー

公開直前にレビューチェックリストを自動生成。最終確認ポイントを見落とさず、責任の所在を明確に。

※ Celsius が提供するのは「社内承認を通しやすくする証跡・レポート」です。外部認証や品質保証書の発行を行うものではありません。

限定企業向けトライアルプログラム

現在ベータ版の開発を進めており、トライアルの開始時期はプレスリリースにて別途ご案内予定です。
事前のご相談・お問い合わせは随時受け付けています。

招待制 · 無償枠

共同検証トライアル

  • 招待制・選定制(応募多数の場合は選考あり)
  • 共同検証にご協力いただける企業が対象
  • 利用範囲・期間・人数に上限あり
  • フィードバックと事例共有へのご協力が条件
  • 導入サポート付き

よくある質問

Claude Code 以外の開発AIエージェントにも対応していますか?
はい。Celsius は Claude Code をはじめ、Gemini CLI、Codex、Open Code、Goose、Copilot CLI など主要な開発AIエージェントに基本対応しています。既存のプロンプトやリポジトリからの取り込みにも対応しており、特定のツールに依存しない設計です。
閉域環境やオンプレミスに対応できますか?
はい。Celsius は閉域環境・オンプレミス・VPN接続環境への導入を前提に設計されています。ローカルLLM(Ollama、vLLM 等)との連携も可能です。
どこまで自動化され、どこで人が承認しますか?
サービスの構成・テスト実行・レポート生成は自動化されます。品質ゲートの通過判定・公開承認は人間が行います。「AIが作り、人が判断する」設計を維持しています。
監査レポートには何が出ますか?
テスト結果、品質スコア、使用モデル情報、入出力サンプル、セキュリティチェック結果、変更履歴を構造化した形式で出力します。社内の承認・説明資料としてそのまま利用可能です。
無償トライアルと有償パイロットの違いは何ですか?
無償トライアルは招待制の共同検証枠で、フィードバックや事例共有へのご協力が条件となります。有償パイロットは即時開始でき、専用環境・カスタマイズ・専任サポートが付きます。
導入までの期間はどれくらいですか?
現在ベータ版を開発中のため、トライアルの開始時期はプレスリリースにて別途ご案内予定です。有償パイロットの場合、開始後は環境構築から初回テストまで最短2週間を想定しています。事前のご相談は随時受け付けておりますので、お気軽にお問い合わせください。

トライアル・デモのご相談

Celsius の導入にご興味をお持ちの方は、以下のフォームからお気軽にお問い合わせください。

送信された情報は AIGYM のプライバシーポリシーに従って取り扱われます。スパム送信は行いません。