#Hugging Face

RSSフィード
おすすめ
公開日:

Hugging Face Spacedでホスティングしているfairseqを利用したアプリをGradio v5へ更新する際に発生した依存関係エラーと対応メモ。

All Posts

News bits

ams-scanner 0.1.0
AI
ams-scanner
Read Article

ams-scanner 0.1.0

オープンウェイト向けに、有害プロンプトを送らず中間層の活性パターンから安全訓練の残存を測る CLI とライブラリがソースで公開され、続いて PyPI にも載った。Apache 2.0。

hrdtbs
hrdtbs 4月27日
3 min read
DeepSeek V4
AI
DeepSeek
Read Article

DeepSeek V4

DeepSeek が V4 系 MoE 言語モデル(Flash と Pro)のプレビューを公開し、百万トークン窓と API・オープンウェイト配布をそろえた。ハイブリッド注意とポストトレーニング手順を主な技術軸として説明している。

hrdtbs
hrdtbs 4月22日
3 min read
Irodori-TTS 500M v2とVoiceDesign公開、絵文字制御とキャプション条件付き日本語TTS
AI
Irodori-TTS
Read Article

Irodori-TTS 500M v2とVoiceDesign公開、絵文字制御とキャプション条件付き日本語TTS

Rectified Flow Diffusion Transformer と DACVAE 連続潜在による日本語 TTS。入力テキストへの絵文字でスタイル・感情・効果音を誘導、短い参照音声からのゼロショット Voice Cloning。v2 は Semantic-DACVAE-Japanese-32dim・学習ステップ約 2.5 倍・前処理とデータフィルタの改善。VoiceDesign はスタイル用キャプション条件付きの別チェックポイント。CLI・Gradio・Hugging Face Hub 推論、コードと公開重みは MIT。日本語入力のみ、漢字読みは同規模他 TTS 比で弱めになる場合あり。

hrdtbs
hrdtbs 3月31日
3 min read

著者について

Hi there. I'm hrdtbs, a frontend expert and technical consultant. I started my career in the creative industry over 13 years ago, learning on the job as a 3DCG modeler and game engineer in the indie scene.

In 2015 I began working as a freelance web designer and engineer. I handled everything from design and development to operation and advertising, delivering comprehensive solutions for various clients.

In 2016 I joined Wemotion as CTO, where I built the engineering team from the ground up and led the development of core web and mobile applications for three years.

In 2019 I joined matsuri technologies as a Frontend Expert, and in 2020 I also began serving as a technical manager supporting streamers and content creators.

I'm so grateful to be working in this field, doing something that brings me so much joy. Thanks for stopping by.