Walton Electronics Co., Ltd.
お問い合わせ

担当者 : Walton-cara

電話番号 : 15986872308

Free call

機械学習は多数のステップを要求する

July 18, 2022

導入

配置の機械学習は(ML)マルチステップ プロセスである。次にそれはテスト データとモデルを選び、特定の仕事のために訓練し、認可し、そして生産でモデルを配置し、そして監察することを含む。ここでは、私達はこれらのステップを論議し、MLに導入するために分類する。MLは、明確な指示なしで、学び、改良することができるシステムを示す。これらのシステムはデータから特定の仕事か機能を行うことを学ぶ。場合によっては、学ぶ。または特定の訓練は正しい出力かの方にそれをすすめるために不正確な出力がモデルの調節で起因する指示された方法に、起こる。それ以外の場合、監視されていない学習によっては前に未知のパターンを明らかにするためにシステムがデータをどこにが組織するか起こる。ほとんどのMLモデルはこれら二つの範例に続く(監視されていない学習対指示される)。掘る意味される、次にデータがleamning機械のための燃料にいかになるか探検するものがにモデルによって今。モデルAモデルを機械学ぶことは機械学習のための解決の抽象的概念である。モデルは定義する建築の。を訓練されてか、なるか実施にどれ。従って、私達はモデルを配置しない。私達はデータ(次のセクションのこれの多く)から訓練されるモデルの実施を配置する。従ってMLの解決(Figure1)の等しい例の訓練とデータとモデル。翻訳は要求される。例えば、深い学習ネットワークへの供給のテキスト データは一般に使用できるさまざまな単語がある高次元のベクトルである数形態に符号化の単語を要求する。同様に、出力は原文の形態に再び数形態からの翻訳を要求するかもしれない。MLモデルは多くのタイプ、ニューラル・ネットワーク モデルを含んで、ベイズ モデル、回帰モデル、群がるモデル、もっと入って来。選ぶことモデルは手もと問題に基づいている。ニューラル・ネットワークという点において、浅い複数の層ネットワークからの多くの層を含んでいる深いニューラル・ネットワークへのモデル範囲

専門にされたニューロン(演算処理装置)の。深いニューラル・ネットワークにまたあなたのターゲット塗布に基づいてモデル利用できるの範囲がある。

例えば:

●あなたの適用がイメージ内の目的の識別に焦点を合わせれば、重畳ニューラル・ネットワーク(CNN)は理想的なモデルである。CNNsは皮癌の検出に適用され、一般の皮膚科医に優っている。

●あなたの適用が(人間の言語文のような)複雑な順序を予測するか、または発生させることを含めば、再発ニューラル・ネットワーク(RNN)またはずっと短い言葉記憶ネットワーク(LSTM)は理想的なモデルである。LSTMsはまた人間の言語の機械翻訳に適用された。

●あなたの適用が人間の言語でイメージの内容をdescrbing含めば、CNNおよびLSTMの組合せは(イメージがCNNに与えられ、CNNの出力が単語順序を出す) LSTMに入力を表すかところに使用することができる。

●あなたの適用が(景色か表面のような)現実的なイメージを発生させることを含めば、生成的な敵対的なネットワーク(GAN)は現在のstatの芸術モデルを表す。これらのモデルは使用中のより普及した深いニューラル・ネットワークの建築の一部を今日表す。深いニューラル・ネットワークはイメージ、ビデオ、または可聴周波情報のような未構造化データを受け入れてもいいので普及している。ネットワークの構造物内の層それらが非常に複雑な情報をclasifyようにする特徴の階層。深いニューラル・ネットワークは問題の範囲の広い数上の最新式の性能を示した。しかし他のMLモデルのよう、正確さはデータに依存しているである。この面を次に探検しよう。

データおよび訓練

データは機械学習を運転する作動中またモデル訓練によってMLの解決を組み立てる燃料、ちょうどである。深いニューラル・ネットワークの訓練データという点において、量および質という点において必要なデータを探検することは重要である。深いニューラル・ネットワークは訓練のために多量のデータを要求する。イメージ ベースの分類のための1目分量は1,000のイメージである

クラスごと。しかし答えは間違いのためのモデルそして許容の複雑さに依存している。生産MLの解決からのある例はデータ・セットのサイズのスペクトルをもたらす。顔のdetectiのおよび認識システムは450,000のイメージを要求し、質疑応答のchatbotは2,000,000の答えと組み合わせられた200,000の質問と訓練された。より小さいデータ・セットはまた解決する問題に基づいて足りることができる。感情の分析の解決detrmines数万のサンプルだけ必要な文書からの意見の極性。データ質は量同じように重要である。訓練に必要な大きいデータ・セットを与えられて誤った訓練データの少量は悪い解決をもたらす場合がある。必要なデータのタイプによってあなたのデータは清潔になるプロセスによって行くかもしれない。これはデータ・セットが一貫していることを保障したり、重複したデータに欠けていたり、正確、完全である(無効か不完全なデータに欠けている)。用具はこのプロセスを支えるためにある。バイアスのデータを認可することはデータが偏りのあるMLの解決をもたらさないことを保障してまた重要である。訓練MLはあなたの解決によって数値データで、そう調査分析のステップことができる要求する作動する。例えば、あなたのデータが人間の言語なら、数形態に処理することを最初に翻訳しなければならない。イメージは一貫性のために調査分析することができる。騒音を取除くために例えば、イメージは深いニューラル・ネットワークにサイズ調整をされ、滑らかになった与えた(他の操作の間で)。MLの最も大きい問題の1つはあなたのMLの解決を訓練するためにデータ・セットを得ている。これはあなたの問題によってあり、別の努力を要求しないかもしれないので最も大きい努力であることができる

捕獲するため。最後に、データ・セットは訓練データとテスト データの間で区分されるべきである。訓練の部分がモデルを訓練するのに使用され解決の正確さを認可するのに一度訓練されて、テスト データが使用されている

 

私達と連絡を取ってください

あなたのメッセージを入れて下さい