<< TOPへ
ACCESS: PROMPT ENGINEERING FOR AUTOMATED WEB ACCESSIBILITY VIOLATION CORRECTIONS
・おもしろい!プロンプトエンジニアリングで、WCAGのガイドラインに違反しているHTMLを修正する仕組みを開発、評価。2024年。
・LLM/ChatGPT+Web Accessibilityでは、まだ研究が少ないので、とうとう出始めた感あり。
・思いついてはいたけれど、やはりプロンプトの書き方は特徴的。
・Few-Shot Guidance, Chain of Thought, ReActの3種類で実施。ReActの方式が最も良い。
・評価のための数式の定義が面白い。
・最後に再現性に対する声明を書いているが、とはいえ読んでいる方としては試してみたいので、データセットとコードが触りたい。。
・あと、Playwright初めて知ったんだけど、なにこれ便利!!!ACCESS: PROMPT ENGINEERING FOR AUTOMATED WEB ACCESSIBILITY VIOLATION CORRECTIONS
・おもしろい!プロンプトエンジニアリングで、WCAGのガイドラインに違反しているHTMLを修正する仕組みを開発、評価。2024年。
・LLM/ChatGPT+Web Accessibilityでは、まだ研究が少ないので、とうとう出始めた感あり。
・思いついてはいたけれど、やはりプロンプトの書き方は特徴的。
・Few-Shot Guidance, Chain of Thought, ReActの3種類で実施。ReActの方式が最も良い。
・評価のための数式の定義が面白い。
・最後に再現性に対する声明を書いているが、とはいえ読んでいる方としては試してみたいので、データセットとコードが触りたい。。
・あと、Playwright初めて知ったんだけど、なにこれ便利!!!
---
```mermaid
graph LR
A[1 はじめに] --> B(ウェブアクセシビリティの重要性)
A --> C(現状のウェブアクセシビリティの問題点)
B --> D[障害を持つ人々のためのウェブコンテンツへの平等なアクセスを確保する上で重要]
C --> E[90%以上のウェブサイトがアクセシビリティ要件を満たしていない]
C --> F[アクセシビリティ違反を自動的に修正するツールが必要]
A2[2 ACCESSベンチマーク] --> B2(データ収集)
A2 --> C2(エラー修正の評価)
B2 --> D2[Playwright APIを使用してウェブサイトのアクセシビリティ違反を収集]
C2 --> E2[修正前と修正後の重大度スコアを比較して評価]
A3[3 ACCESSエージェント] --> B3(React プロンプティング)
A3 --> C3(Few-Shot ガイド付きプロンプティング)
A3 --> D3(トランスフォーマーモデル)
B3 --> E3[LLMにアクセシビリティ違反の修正を促す]
C3 --> F3[コンテキスト内の例を使用してモデルの学習を改善]
D3 --> G3[GPT-3.5-turbo-16Kモデルを使用]
A4[4 結果] --> B4(重大度スコアの減少)
B4 --> C4[React プロンプティングが最も効果的で、51.303%の減少]
B4 --> D4[GPT-4はGPT-3.5-turbo-16Kよりも4.891%優れたパフォーマンス]
A5[5 考察] --> B5(研究の社会的影響)
B5 --> C5[ウェブアクセシビリティの欠如により、障害者が重要なオンラインサービスを利用できない可能性]
B5 --> D5[提案された自動化ソリューションは、これらの問題に対処する可能性]
A6[6 結論] --> B6(研究成果のまとめ)
A6 --> C6(将来の研究の方向性)
B6 --> D6[GPTモデルとプロンプトエンジニアリングを用いて、アクセシビリティ違反を51%減少]
C6 --> E6[データセットの多様性を高め、深層学習技術を統合することが今後の課題]
```