モデルのテスト
現時点で、Mistral-7Bモデルは利用可能か、または利用可能になる直前のはずです。以下のコマンドを実行して確認できます。このコマンドはモデルがまだ実行されていない場合、実行されるまでブロックします:
~$kubectl rollout status --timeout=600s deployment/mistral -n vllm
直接APIコールでのテスト
Deploymentが正常になったら、curlを使用してエンドポイント の簡単なテストを実行できます。これにより、モデルが推論リクエストを正しく処理できることを確認できます。
次のペイロードを送信します:
~/environment/eks-workshop/modules/aiml/chatbot/post.json
{
"model": "/models/mistral-7b-v0.3",
"prompt": "The names of the colors in the rainbow are: ",
"max_tokens": 100,
"temperature": 0
}
テストコマンドを実行します:
~$export payload=$(cat ~/environment/eks-workshop/modules/aiml/chatbot/post.json)
~$kubectl run curl-test --image=curlimages/curl \
--rm -itq --restart=Never -- \
curl http://mistral.vllm:8080/v1/completions \
-H "Content-Type: application/json" \
-d "$payload" | jq
{"id": "cmpl-af24a0c6ef904f0bb7e2be29e317096b",
"object": "text_completion",
"created": 1759208218,
"model": "/models/mistral-7b-v0.3",
"choices": [
{"index": 0,
"text": "1. Red 2. Orange 3. Yellow 4. Green 5. Blue 6. Indigo 7. Violet\n\nThe order of the colors in a rainbow is determined by the wavelength of the light. Red has the longest wavelength, and violet has the shortest. This order is often remembered by the acronym ROYGBIV, which stands for Red, Orange, Yellow, Green, Blue, Indigo, and Violet.",
"logprobs": null,
"finish_reason": "length",
"stop_reason": null,
"prompt_logprobs": null
}
],
"usage": {"prompt_tokens": 13,
"total_tokens": 113,
"completion_tokens": 100,
"prompt_tokens_details": null
},
"kv_transfer_params": null
}
この例では、プロンプト The names of the colors in the rainbow are: を送信し、LLMは虹の色を順番に説明するテキストで補完しました。LLMの非決定論的な性質により、受け取る応答は、特に温度値が0より大きい場合、ここに示されているものと若干異なる 場合があります。
チャットインターフェースのテスト
より対話的な体験のために、デモウェブストアにアクセスして統合されたチャットインターフェースを使用できます:
~$LB_HOSTNAME=$(kubectl -n ui get ingress ui -o jsonpath='{.status.loadBalancer.ingress[*].hostname}{"\n"}')
~$echo "http://$LB_HOSTNAME"
http://k8s-ui-ui-5ddc3ba496-1812344516.us-west-2.elb.amazonaws.com
画面の右下に「Chat」ボタンが表示されます:
http://k8s-ui-ui-5ddc3ba496-1812344516.us-west-2.elb.amazonaws.com

このボタンをクリックすると、小売店アシスタントにメッセージを送信できるチャットウィンドウが表示されます:
http://k8s-ui-ui-5ddc3ba496-1812344516.us-west-2.elb.amazonaws.com
