有名テック企業の技術ブログを、ひとつのフィードで。
フィード
20件
こんにちは!e-dashでQAエンジニアをしている10mo8です。 AIによってソフトウェア開発ライフサイクルが速くなったことで、E2Eテスト(本記事では、自動と手動を含めたLargeサイズのテストとします)のテストスコープは広がり、リリースサイクルは短くなる傾向にあります。開発速度は加速し続けますが、テスト能力はそれに追いついていない——このギャップを埋めることが急務です。また、開発スピードに追いつく速さでQA人材を確保することも現実的ではありません。 この変化に対応するために「シフトレフトしてE2Eテストの依存度を減らす」「E2Eテストの品質を落とさずにリードタイムを削減する」この2...
こんにちは。e-dash の yuuki1036 です。 私はClaude Code で skill を組み合わせた開発用のワークフローを組んでいます。skill 間に共通する指示は CLAUDE.md に記載することで動作させていたのですが、skill を作り込んでいくうちに CLAUDE.md の指示が増え、意図通りに動かないことが多くなりました。そこで AI に指示して Plugin 化してみたところ、思っていた以上に改善が回しやすくなったので、その経緯を書きます。 Skills を作り込むと何が起きるか Skills はトークンの消費を抑えながら、ある程度複雑な指示をカプセル...
はじめに この1年間、CO2排出量算定サービスのOCR機能の開発・改善に関わってきました。電気やガス、ガソリンなどのエネルギーの請求書から使用量や金額を読み取る機能です。 この記事では、OCRの精度改善や手動入力連携を通じて得た知見をまとめます。 以前の記事「請求書読み取りにおけるOCRとLLMの最適な役割分担[1]」では手法比較の結果をまとめましたが、今回はもっと泥臭い開発の紆余曲折を書いていきます。 フェーズ1:現状把握と最初の一手 まず現状を知ることから始めた 最初にやったのは「今のOCRはどんな仕組みで、どう改善できるか」を理解することでした。 当時の仕組みはこうで...
はじめに 「なんでそこにあるデータを見てくれないかなぁ(泣)」…RAGを自作した人なら、一度はこう思ったことがあるのではないでしょうか。 私自身、社内情報検索用のチャットボットをRAGで構築しましたが、回答精度がなかなか上がりませんでした。チャンクサイズを調整し、ハイブリッド検索を導入し、リランキングを入れ、プロンプトをこねくり回しても、ユーザーの曖昧な一言で検索が空振りする。そこにあるはずのデータに辿り着けない。加えて、言語モデルやツールがどんどん進化するので、チャットボットへの期待値も勝手に上がっていきます。質問者は「当然正確に答えてくれるだろう」と思っている。回答の生成自体は...
こんにちは、e-dash の中村です。最近は Claude Code や Cursor などのコーディングエージェントを使って開発しています。コーディングはエージェントが書き、レビューもエージェントがやり、テストもエージェントが書く。自分は何をしているのかというと、エージェントの出力を眺めて承認するだけです。もはやエンジニアというよりはAIエージェント管理職ですね。 そんなAIエージェント管理職をやっていて怖くなったことがあります。CLAUDE.mdに改善を加えてチームに展開した際に、根拠を聞かれたら何も返せないのです。 コーディングエージェントの評価について エージェントに渡すド...