吉祥寺北口システムが気になった記事をクリップしています。タイトルから元記事にリンクしています。タグは記事タイトルを形態素分析しています。たまにコメントをつけています。

Inferentia

AWS Trainium、AWS Inferentia が AWS 上の Llama 3.1 モデルに高性能と低コストを提供 | Amazon Web Services ブログ
AWS Trainium を活用した日本語大規模言語モデルの分散学習と AWS Inferentia2 上での推論環境構築 | Amazon Web Services ブログ
AWS Inferentia と AWS Trainium を用いた、AWS SageMaker JumpStart によるコスト最適化された Llama 2 モデルのファインチューニングとデプロイ | Amazon Web Services ブログ
Amazon EC2 Inf1、Inf2 インスタンスにおける FastAPI と PyTorch モデルの AWS Inferentia 利用時の最適化 | Amazon Web Services ブログ
AWS Inferentia2 で Stable Diffusion のパフォーマンスを最大化し、推論コストを削減する | Amazon Web Services ブログ
Amazon SageMaker 上で AWS Inferentia2 と AWS Trainium を使って、低コストで高性能な生成系 AI 推論を実現 | Amazon Web Services ブログ
大規模モデル推論コンテナを使って AWS Inferentia2 に大規模言語モデルをデプロイ | Amazon Web Services ブログ
ByteDance が AWS Inferentia の利用により、推論におけるレイテンシの削減とスループットの向上とともに、最大で60
Exafunction で AWS Inferentia による機械学習推論のベストプライス・パフォーマンスを実現 | Amazon Web Services ブログ
Amazon Search がAWS Inferentiaで検索システムのコストを85
AWS CDK で作る AWS Inferentia と Amazon ECS を利用した推論環境(Part 2) | Amazon Web Services ブログ
AWS CDK で作る AWS Inferentia と Amazon ECS を利用した推論環境(Part 1) | Amazon Web Services ブログ
InfoJobs (Adevinta) が AWS Inferentia と Amazon SageMaker で NLP モデル予測のパフォーマンスをどのように向上させたか | Amazon Web Services ブログ
AWS Inferentiaを使用して Amazon EKS で 3,000種類のディープラーニングモデルを 1 時間あたり 50 USD 以下で提供 | Amazon Web Services ブログ
機械学習と AWS Inferentia を使用した広告検証のスケーリング | Amazon Web Services ブログ
AWS Inferentia上のPyTorch自然言語処理アプリケーションにおいて、12倍のスループットと最小のレイテンシーを実現 | Amazon Web Services ブログ
AWS Inferentiaを搭載した Inf1インスタンスが東京リージョンで利用可能になりました | Amazon Web Services ブログ
Amazon EC2アップデート – 高性能で費用対効果の高い推論のための AWS Inferentia チップを搭載した Inf1 インスタンス | Amazon Web Services ブログ