Yay! GPT4V and Dall-e3 were lifted for me last week! | やった!! GPT4VとDall-e3が私にも先週解禁されました

in Hive JA7 months ago (edited)

[EN]
Embracing the AI Life, Are We?

Lately, I find myself consistently entwined with GPT-4, even within my professional endeavors. From web development and project management to light documentation and weightier undertakings, GPT-4 reveals itself as a rather potent collaborator. It's on hand for a myriad of tasks – a brainstorming partner during creative droughts, an assistant in crafting RFPs (Request for Proposals), a summarizer of PDFs, an editor of emails, and a proficient organizer, converting scattered information into neatly tabled formats... The list goes on, and it does so brilliantly.

With only a few thousand yen a month, I have access to this stellar assistant that, without complaint, responds diligently, unquestionably elevating both the quality and efficiency of my work.

Amidst this, around September 25th, OPENAI unveiled new tools: GPT-4V and Dall-e3, updates capable of image recognition and generation, respectively. After a tantalizing 2-week rollout for premium users, plus a few extra days of anticipation, my account was finally updated, and I’ve been joyfully exploring ever since.

As for GPT-4V, I am trying to get it to load images and then create html and css, etc., still in the process of trial and error.

Conversely, my initial interest in Dall-e3 was mild at best, having previously experimented with image generation via stablediffusion on Google Colab. However, once experienced, the convenience of directing generated images through natural language and its commercial usage capabilities proved utterly astonishing. It's compelling, witnessing such progress and feeling the era of widespread adoption advancing.

Animation GIFs, logos, portraits, and more can be created with ease. For instance, when the ‘depiction of a key inside a bottle’ – a natural language directive that Bing Image Creator failed to realize – was requested from Dall-e3, it was beautifully generated.

Quite the creation, isn’t it? 😄 And there was this animation Gif I attempted after seeing something similar on X...

[Requested: A Pixel Art Sprite Sheet Expressing a Detailed 32-Frame Animation of a Running Robot]





Thinking it’d be godly if GPT could auto-process this, I uploaded the file to GPT, asked for 32 frames at 0.2 seconds each, and ended up with this:


It’s... something different, but hey, the potential is there!! And with that, the experiment concluded. I thought that with a bit more precise instructions, we could refine it, but just the instant generation of the sprite sheet itself is quite something. Next is to polish up the ideas, right?!

So, amidst these time-starved days,
may you all revel in an exhilarating AI life!!

[Translation GPT-4]

[JA]
みなさん良いAI生活してますでしょうか?

私は、最近は仕事でもGPT-4をよく使っています。
Web制作やプロジェクトの進行など、ちょっとした資料作りから重みのあるものまで、GPT-4は思いの外、強力な協力者です。
GPT4には、アイデアが出ない時の壁打ち相手、RFP(情報提供依頼書)の制作手伝い、PDFの要約、メールの添削、まとまりのない情報をグループ化して整列させてテーブル表現にするなどなど...実に多岐にわたり頑張ってもらってます。

優秀なアシスタントを毎月数千円で使える(あと文句を言わずに丁寧に答えてくれる)ので、おかげで、業務のクオリティも効率も、間違いなく向上しています。

そんな中、9月25日ごろにOPENAIから新しいツールが登場。GPT-4VとDall-e3という画像認識・生成ができるアップデートが発表されました。2週間かけて有料ユーザーに展開するというので、楽しみに待っていたのですが、2週間とプラス数日を経てようやく私のところにもアップデートがされ、楽しくいじっております。

GPT-4Vは、仕事で使えそうな機能だなと思っていて、デザインを読み込ませてwebページを作ったりなどもできそうだなぁ思い、現在試行錯誤中です。

一方で、Dall-e3については、過去にGoogle Colabでstablediffusionを利用し、画像生成の実験を重ねていたので、最初はあまり関心を持っていませんでした。しかし実際に使用してみると、生成した画像に対し自然言語で指示できる利便性には驚かされました、あとは商用利用も可能ということで、これは強力ですね!
この進歩を目の当たりにするたび、万人に使われていく時代が進んでいくのを感じたりしています。

アニメーションGIFやロゴ、人物写真なども簡単に作成することができます。例えば以前、Bing Image Creatorでうまく行かなかった「ボトルの中に鍵が入っている様子」という自然言語の指示をDall-e3にお願いすると、見事に生成してくれました。

いい感じで作ってくれているw
あとXでちらっと流れてきていた、アニメーションGifもちょっと作ってみたのですが・・・

[アニメーションGifの元になる、32フレームでのロボットの詳細な走行アニメーションを表現したピクセルアートのスプライトシートを作成依頼]




これを自動でGPTで処理してくれたら神だなと思いつつ、GPTさんにファイルアップして、32フレームの0.2秒でよろしく!と雑な依頼をしたところできたファイルはこちら






なんか違うけど、まぁ、ポテンシャルはある!!
と思い一旦ここで実験は終了しました。もう少し精度を上げる指示などを出して作ってくれるだろうなぁと思いましたが、スプライトシートをこのように瞬間的に書いてくれるならそれだけでもいいかとも思いました。
あとはアイデアを磨かないとですね!

という感じで時間が足りない今日この頃ですが、
みなさんも楽しいAI生活を送ってください!!

Sort:  

へぇ~~~。すごいですねぇ~。優秀なアシスタントを毎月数千円で使える(あと文句を言わずに丁寧に答えてくれる)、ってすごくわかる!👏👏
!love

コメントありがとうございます!mizuoさんも使用されてますか??
本当に文句言わないですし、すごく頭いい子ですよね!答えをたまに間違えとか混ぜてくるお茶目なところもありますが、良い付き合い方ができれば界王拳3倍って感じですよね!

わたしもつかっていますよ、ChatGPTの無料版をつかいまくっています。でも、GPT4V と Dall-e3もすごいんですねぇ~~。界王拳3倍、テンション激上げ。
!love

@iroha, @mizuo(4/10) sent LUV. | connect | community | HiveWiki | NFT | <>< daily

Join in Hive General chat | Type ! help (no space) to get help on Hive. Info

Made with LUV by crrdlx

@iroha, @mizuo(1/10) sent LUV. | connect | community | HiveWiki | NFT | <>< daily

Join in Hive General chat | Type ! help (no space) to get help on Hive. Info

Made with LUV by crrdlx

Yay! 🤗
Your content has been boosted with Ecency Points, by @go-kyo.
Use Ecency daily to boost your growth on platform!

Support Ecency
Vote for new Proposal
Delegate HP and earn more