IT業界、44年やってます (老人の独り言) 

現在69歳、IT関連で勉強したい事が盛りだくさんで、目移り状態です(^o^)

次の派遣先で働いてます

12月から働き始めた会社が、予算が厳しくなり半年で今年6月末で契約解除となりました。

上司は能力の問題では無かったと言って貰いました。お世辞を言う方では無いので、少し心が上向きになりました。

 

さっそく次の会社を探しはじめ、派遣元から5社ほど紹介を受けその中で2社で面接を受ける事になり、1社NG、1社OK。

 

良かった!中断無く、次の会社に勤める事が出来ました。しかしほぼ70歳の自分を雇ってくれる所はどんな所か心配でしたが、全社的にベテランが多い会社で、自分の年齢でも違和感が無く、勤めやすい所で本当に良かったと思いました。

 

それに社内アプリの開発に関わり、それほど納期に関して厳しく無く、派遣に無用なプレッシャーも無いです。同じ派遣元からベテランエンジンが9月から加わり、更にもう一人追加で要求しているそうです。

 

自分の仕事はいろいろで、過去の経験を活かすことが出来、良い派遣先に出会えたと嬉しい思いです。

 

ただ自分は来年70歳です。そろそろ働き方も年齢に合った時短にしてもらう様にしないといけないと思ってます。それに収入制限の関係で、年金が減額されているのも腹が立つ、お馬鹿な国の方針です。ほんとやる気が削がれます。

 

昨年9月に4年勤めた会社をやめて、新しい会社に派遣

昨年(2023年)の9月末に4年間勤めた会社を退職。理由として、片道2時間の長距離通勤が嫌になったのと、上司の理解のなさで嫌気がさしたためです。

 

失業保険をもらって、ハローワークで10月いっぱい求職したのですが、全部書類選考で落とされました。仕方がないので、11月に人材派遣会社に登録したら、10社ほど紹介してもらいましたが、やはり書類選考で落とされていた様ですが、2社が引っかかり面接となりました。12月初旬に面接が有り、両方とも採用を頂けました。

 

大阪のIT会社に派遣となり、自分は埼玉なので、フルリモートで働いてます。

 

 

 

 

LLM を勉強しようとして挫折・・・トホホ

前の記事で LLM を勉強するために「Natural Language Processing with Transformers」を読み始めたと書きましたが、NLP(自然言語処理) の基本的な概念が分かって居ないため、全然進めない・・・

 

そこで、「ゼロから作るDeep Learning ❷ ―自然言語処理編」

を図書館で借りて、基礎からやり直し、基礎的な概念をつかめました。その間2週間。

やっと以前の紹介した本の翻訳本「機械学習エンジニアのためのTransformers」を攻略可能になりました。現在第二章を読んでます。個々のトピックスがとても素晴らしいです。

 

大規模言語モデル(LLM) の技術に興味が有ります

アメリカ GAFAM を中心とした企業で 大規模言語モデルを利用したチャットAI の開発が過熱してます。日本もサイバーエージェントソフトバンク、rinna株式会社が LLM(Large Language Model) 開発を表明して公開してます。

 

その公開先は Hugging Face 社の Hub です。

Hugging Face Hub documentation

 

この会社は業界標準的な Transformers ライブラリ を開発して、公開してます。


Transformers ライブラリは、文章、画像、音声でのタスクを行う Transformer のオープンソースPython パッケージである。PyTorch、TensorFlow、JAX ライブラリと互換性があり、BERT や GPT モデルのような著名なモデルの実装も含まれる。

 

以下の本がそのライブラリの利用を説明してます(オライリー・ジャパン日本語翻訳版有り)ちなみに ChatGPT(モデル:GPT-4)に翻訳させてます。分からない専門用語はその場で深掘り出来ます。

 

興味深い話題が満載。さっそく Git Hub で公開されている python の例題で第二章を試したのですが、Google Colab とか使っても、無償タイプだとメモリ不足になりました。

 

そこで、半導体不足で高騰してましたが、以前から欲しかった NVIDIA の グラフィックボードを購入しました。RTX 3060(12GB) 4万6千円で購入。補助電源ケーブルで8ピン・タイプが必要だったのですが、PCの電源が6ピンが2つ余っていたので、6+6=>8ピンのケーブルが有ったので、合わせて購入しました。今のグラフィックボードを抜いて、入れ替えます。特に問題なく入れ替え完了。

GALAKURO GAMING GG-RTX3060-E12GB/OC/DF[PCIExp 12GB]

例題を試した所、問題なく実行出来そうなので安心しました。

 

◎本の各章は

第1章「Hello Transformers」では、トランスフォーマーを紹介し、そのコンテキストを説明します。また、Hugging Faceエコシステムについても紹介します。


• 第2章「テキスト分類」は、感情分析(一般的なテキスト分類問題)を対象とし、Trainer APIを紹介します。

• 第3章「トランスフォーマーの解剖学」は、トランスフォーマーアーキテクチャをより深く探求し、次の章の準備をします。

• 第4章「多言語の固有エンティティ認識」は、複数の言語でテキストのエンティティを識別するタスク(トークン分類問題)に焦点を当てます。

• 第5章「テキスト生成」では、トランスフォーマーモデルがテキストを生成する能力を探り、デコーディング戦略とメトリクスを紹介します。

• 第6章「要約」は、テキストの要約という複雑なシーケンス間タスクを詳しく見て、このタスクで使用されるメトリクスを探ります。

• 第7章「質問応答」では、レビューベースの質問応答システムの構築に焦点を当て、Haystackを用いた検索を紹介します。

• 第8章「製品化でのトランスフォーマーの効率化」は、モデルのパフォーマンスに焦点を当てます。私たちは意図の検出(シーケンス分類問題の一種)のタスクを見て、知識蒸留、量子化、剪定などの技術を探求します。

• 第9章「ラベルが少ないからない場合の対処法」では、大量のラベル付きデータがない場合のモデルパフォーマンスの向上方法を探ります。GitHubの問題タグ付けシステムを構築し、ゼロショット分類やデータ拡張などの技術を探ります。

・第10章「トランスフォーマーのゼロからの訓練」では、Pythonソースコードを自動補完するモデルをゼロから構築し訓練する方法を示します。データセットのストリーミングと大規模訓練を見て、自分たちのトークナイザーを構築します。

• 第11章「未来の方向性」では、トランスフォーマーが直面している課題と、この分野の研究が進む興奮する新たな方向性を探ります。

 

今は ChatGPT への興味がいっぱい

毎日大量に ChatGPT 関連の話題がいろいろなメデイアにアップされてます。最近自分の流行は ChatGPT に関する YouTube 記事(特にテレ東関連)が面白いです。

 
かなりハマりすぎてます。今日も図書館に行って、「先読みChatGPT」って本が有ったので借りてきました。その中で面白い記述が有ったので紹介します。
 
「ラーメンに例えるなら、本格的にスープや麺を作るのが従来のAI開発で、カップラーメンがGPTモデルと考えてください」
 
すなわち、今までの AI開発は全てをゼロから構築する必要が有るけど、ChatGPT を使ったものは、簡単に作れるって事です。
 
実際  IBM のAI担当の重役さんが言ってましたが、今までのAI は規模が大きな会社は作ったり、メンテナンス出来るけど、小さな会社では出来ない。小さな会社は最初だけは頑張って作れるけど、結局はメンテナンスに費用が掛かり過ぎるので、メンテナンス出来ず放置され野良AI化してゆくそうです。
 
確かに OpenAI API を見ると、簡単なんですが、とにかく強力。これだと既存にアプリに簡単に導入出来ちゃいますね。入力した情報からは学習はしないとの事で、秘密漏洩は守られます。
 
あとファインチューニングって機能が有って、特別な分野の知識を強化する事が出来るので、アプリの目的に応じたチューニングが簡単に出来て、人間の様な受け答えが出来て、なにか夢の世界がいきなり現実になった感じです。
 

ChatGPT が素敵すぎる

今日 ChatGPT Plus (月額 20.00 USD) を契約しました。

 

自分の仕事の質問をしてみました。自分の苦手にしていた、 Bash スクリプト の作成と 時限起動の設定です。

追加質問で要件を付け加えて行くとどんどんと出来上がってゆきます。

あとは苦手な SQL 作成の手伝いをして貰います。

 

年寄りの自分にとって技術者としてしばらくは食べて行けそうです。

VS Code with ChatGPT

プログラムの自動化ってずっと先かと思ってたのが、古い事が分かりました。

 

なにげに Youtube で今日の渡辺名人と藤井聡太竜王名人戦の記事を見てて、偶然見たのですが、VS Code拡張機能ChatGPT - Genie AI 

なんか便利そうで、明日から仕事で使えそうな感じでした。

 

ネットで調べたら、既に良く使われている事が分かりました。ただ仕事のコードが漏れてしまうのはちょっとやばい。