Yapay Zeka'daki İşlevleri Anlamak

3 yıl önce

Yapay zeka alanında yaptığımız her bir veri dönüşümü, girdi-veriyi çözmeyi hedeflediğimiz görev için gereken en temsili biçime dönüştürmeye çalışır ... Bu dönüşüm işlevler aracılığıyla yapılır.

Bir makine öğrenimi modeli, girdi verilerini anlamlı çıktılara dönüştürür. Bilinen girdi ve çıktı örneklerine maruz bırakılarak "öğrenilen" bir süreç.

Böylece, ML modeli "Bir işlevi, giriş verilerini beklenen çıkışa getiren bir işlevi kazandırır.

f (x) = Â y_hat

Bu nedenle, Makine öğrenimi ve Derin öğrenmedeki temel sorun, verileri anlamlı bir şekilde dönüştürmektir: Başka bir deyişle, elimizdeki girdi verilerinin yararlı temsillerini öğrenmek - bizi beklenen çıktıya yaklaştıran temsiller - (Francois Chollet)

Birkaç veri noktasından oluşan bir tablomuz var, bazıları "beyaz" sınıfına, diğerleri "siyah" sınıfına ait. Onları planladığımızda, 'şuna' benziyorlar

Gördüğünüz gibi, birkaç siyah beyaz noktamız var. Diyelim ki, bir noktanın koordinatlarını (x, y) alabilen ve bu noktanın siyah (sınıf 0) veya beyaz (sınıf 1) olup olmadığını çıkarabilen bir makine öğrenimi algoritması eğitmek istediğimizi varsayalım.

En az 4Â şeye ihtiyacımız var

Nihayetinde, burada modelden ihtiyacımız olan şey, beyaz noktaları siyah noktalardan temiz bir şekilde ayıran verilerimizin yeni bir temsilidir.

Bu yeni temsil, bir koordinat değişikliği kadar basit veya polinom veya rasyonel veya logaritmik, trigonometrik ve üstel fonksiyonların bir kombinasyonunu dışarıya verilere uygulamak kadar karmaşık olabilir.

Bir miktar optimizasyondan ve bir şans darbesinden sonra, algoritmamızın yukarıdaki 3. gösterimi öğrendiğini ve bu kuralı karşıladığını varsayalım:

{Black points değerleri var> 0, beyaz noktaların değerleri var  ‰ ¤Â 0}

Bu, modelimizin bir "fonksiyon" (f x, f (x) olarak yazılır) ile gösterilebilen ve girdi verilerini çıktı hedefine şu şekilde eşleyen "verilerimizin bir temsilini öğrendiği anlamına gelir:

F (x) = 0 (â € ~blackâ, eğer x> Â 0)

f (x) = 1 (â € ˜Beyazâ € ™, eğer x â ‰ ¤Â 0)

Bu işlevle, umarız, model, siyah ve beyaz noktaların gelecekteki görünmeyen verilerini sınıflandırmak için genelleme yapabilir.

Öyleyse Heck Gerçekten Bir İşlev Nedir?

Florida ABD'de bir kurye ofisinde olduğunuzu ve Sidney Avustralya'daki bir konuma bir x parsel gönderdiğinizi hayal edin. Temsilci, parselin ağırlığını Wx ve Florida ile Sidney arasındaki Dx mesafesini girer ve size bir ücret C yazar. , 500 $.

Bu, 500 $ 'lık C yükünün, Dx mesafesinin ve x parselinin ağırlığının Wx bir fonksiyonu olduğu anlamına gelir.

Daha fazla maliyet hesaplayıcısının, Hidar Hidden Fonksiyonu H, herhangi bir parselin mesafesine ve ağırlığına, A® şarjına ulaşmasını sağlayalım.

Bu işlemin tamamı bir f (x) fonksiyonu olarak yazılabilir, öyle ki:

f (x) = H (Dx, Â Wx)

Başka bir deyişle, verilen x C, Dx ve Wx'e bir miktar hesaplama uygulayan gizli bir H fonksiyonunu alan bir f (x) fonksiyonunun sonucudur.

Bu, şununla aynıdır:

C = H (Dx, Â Wx)

Hangisi aynıdır:

500 $ = Hidden_function (Parselin-x mesafesi, Parselin-ağırlığı-x)

Dolayısıyla, işlevler kavramı her yerde bulunur ve işlevler çevremizdeki her yerde bulunur. Fonksiyonlar aracılığıyla birkaç yapıyı temsil edebiliriz. Örneğin, "bu" denilebilir.

İyi bir yaşam sürmek, sağlıklı yaşamın ve refahın bir işlevidir.

Sağlıklı yaşam için h'yi ve zenginlik için w'yi ve iyi yaşam için x'i belirtirsek, bu ilişkiyi önemsiz bir şekilde şöyle yazabiliriz:

f (x) = h + Â w

Biraz Matematikâ € ¦

Matematik, Fonksiyonlardaki değişiklikleri tanımlayan matematiktir.

Matematik çalışmak için gerekli işlevler şunlardır: -

Calculus'ta daha derine inmeden, bir fonksiyonun tanımını görelim:

Bir işlev, birinci kümenin (etki alanı) her öğesinin ikinci kümenin (aralık) tam olarak bir öğesi ile ilişkili olduğu özel bir ilişki türüdür.Herhangi bir işlev için, girdiyi bildiğimizde çıktı belirlenir, bu nedenle biz bir fonksiyonun çıktısının girdisinin bir fonksiyonu olduğunu söyleyin.

Örneğin, bir karenin alanı yan uzunluğu ile belirlenir, bu nedenle alanın (çıkışın) yan uzunluğunun (girişi) bir fonksiyon olduğunu söylüyoruz.

Herhangi bir işlev için, girdiyi ve kuralı bildiğimizde çıktı belirlenir, bu nedenle bir işlevin çıktısının girdisinin bir işlevi olduğunu söyleriz.

Bu basitçe, herhangi bir f fonksiyonunun bir dizi girdi (etki alanı), bir dizi çıktı (aralık) ve her girdiyi tam olarak bir çıktıya atamak için bir kuraldan oluştuğu anlamına gelir.

Bir işlev, etki alanındaki her öğeyi aralıktaki tam olarak bir öğeyle eşler. Her giriş yalnızca bir çıkışa gönderilebilmesine rağmen, aynı çıkışa iki farklı giriş gönderilebilir (yukarıdaki 2Â'ye eşlenmiş 3 ve 4'e bakın).

Gerçek, Doğal ve Negatif Sayılar:

Yapay zeka ile 'sayılar' olmadan herhangi bir faaliyet gerçekleştirmek imkansız olduğundan, yukarıdakilere ilişkin bilgilerimizi hızla tazeleyelim

Gerçek sayılar kümesi, negatif sonsuzdan sonsuza kadar olan sayılar kümesidir.

Aralıklı gösterimde, x, Â içinde ise, x bir gerçek sayı olarak yazılabilir:

(-inf, inf): negatif sonsuzdan küçük ve sonsuzdan küçük

Küme gösteriminde:

{x | -inf

Gerçek sayılar kümesi, kesirlerden kayan sayılara, rasgele boyutların negatif ve pozitif sayılarına kadar her türden bir süper sayı kümesidir.

Doğal sayılar kümesi, aralıktan pozitif sayıların (0, sonsuzluk)

Aralıklı gösterimde:

[0, inf): 0 içerir ancak sonsuzdan küçüktür.

Küme gösteriminde:

{x | 0â ‰ ¤ x}: x, 0 â ‰ ¤Â x

Negatif sayılar kümesi, 0'dan küçük tüm sayıların kümesidir

Aralıklı gösterimde:

(-inf, 0): Neg-sonsuzdan küçük ve 0'dan küçük.

Küme gösteriminde:

{x | x <0}: x, x

Etki Alanını ve İşlev Aralığını Keşfetmek:

Belirli bir işlev verildiğinde, onun alanını ve aralığını nasıl belirleyebiliriz? Böyle bir işlevin hangi yasal girdileri alabileceğini ve hangi yasal çıktıları üretebileceğini nasıl anlayabiliriz?

f (x) = Â maks (0, x)

Yukarıdaki ifade, herhangi bir x girdisi için işlevin 0 ile x arasındaki maksimum değeri döndürdüğü anlamına gelir.

Başka bir kısıtlama olmaksızın, x'in herhangi bir sayı olduğunu varsayabiliriz, öyle ki:

{x | -inf

Bu nedenle, bu fonksiyonun alanı gerçek sayıların dizidir. Ve, bu fonksiyonun çıkışı en az 0 ve maksimum herhangi bir sayıdan oluştuğundan, bu işlevin aralığını doğal sayıların (0, INF) veya {y | Y Â ‰ ¥ Â 0 olarak belirtiriz. }.

-10 ile 10 arasındaki bir sayı aralığını kullanarak yukarıdaki işlevi çizelim.

https://medium.com/media/71d241efffc684ed8fcb335b516a842d/href

Araştırmakta olduğumuz işlev, tüm popüler Doğrultulmuş Doğrusal Birimdir. AKA Relu aktivasyon işlevi. Relu çok basit ama çok güçlü.

Belki de Reldur'un yüksek puanı, sırtüstü olmayan bir aktivasyon fonksiyonuyla derinlemesine çok katmanlı ağları eğitmek için başarılı bir uygulamadır.

f (x) = sqrt (x + 3) + Â 1

Yukarıdaki ifade, herhangi bir x girdisi için işlevin (x + 3) + Â 1'in karekökünü döndürdüğü anlamına gelir.

Etki alanını bulmak için fonksiyonun kuralına dikkat etmemiz gerekir. Burada, kuralın bir parçası olarak bir karekök fonksiyonumuz var. Bu bize otomatik olarak karekök içindeki ifadenin minimum değerinin 0 olması gerektiğini söyler. Çünkü negatif sayıların karekökünü bulamıyoruz.

Öyleyse etki alanını bulmak için, SORUMUZ SORUMUZ SORUMUZ? X'in hangi değeri en az 3'e eklemeliyiz?

x + 3 = 0â € ¦ Bu nedenle: x = Â -3

Bu nedenle fonksiyonun alanı {x | x  ‰ ¥ -3} veya [-3,  inf).

Kural ve etki alanıyla aralığı kolayca bulabiliriz. Minimum -3 değerini x olarak koyarsak. Daha sonra fonksiyon, 0'ın sqrt'sine, yani 0'a, artı 1'e, yani 1'e değer verir. Dolayısıyla, aralık [1, inf) veya {y | y â ‰ ¥ Â 1} 'dir.

Herhangi bir fonksiyon için, girişi ve kuralları bildiğimizde, çıktı belirlenir, bu nedenle bir fonksiyonun çıkışının, girişin bir işlevi olduğunu söylüyoruz.

f (x) = 1 / (1 + Â e ^ -x)

Yukarıdaki ifade, herhangi bir x girdisi için fonksiyonun 1 / (1 + e, negatif x'e yükseltilmiş) döndürdüğü anlamına gelir; burada e, Euler sayısıdır = Â 2,71828.

Peki bu fonksiyonun etki alanını nasıl anlayacağız?

İşleve baktığımızda, x'in aslında tabanı e olan üs olduğunu görebiliriz. Bu nedenle x gerçekte ne olursa olsun herhangi bir değeri alabilir. Bunun nedeni, taban 0 olmadığı ve! = Â 1 olmadığı sürece, üstel bir fonksiyonun etki alanının aslında tüm gerçek sayıların kümesi olmasıdır.

Peki, menzil ne olacak?

Etki alanının herhangi bir değere sahip olabileceğini anlamak, bizi kurallara yönlendirir. İlk fark ettiğimiz şey, negatif X'in üssüdür. 0'nın üssü 1 olduğundan, negatif bir sayının üssü [0, Â 1) içinde olmalıdır.

Öyleyse, üs parçası 0 döndürürse, 1 / (1 +0) = 1 elde ederiz. Başka bir v değeri döndürürse, burada 0

Bu nedenle aralık (0, 1] veya {y | 0

Evet! Az önce araştırdığımız fonksiyon Sigmoid-Aktivasyon-Fonksiyonudur, bu fonksiyonu İkili Sınıflandırma görevlerine uygun bir Lojistik-Regresyon fonksiyonuna dönüştürmek için Doğrusal Regresyon fonksiyonuna yerleştirdiğimiz başlıktır.

https://medium.com/media/19f8b2db2921381e566efcf0f70e0ea9/href

Y_HAT = W1X1 + W2X2 + Â B

Yukarıdaki denklem, X1 ve X2, Ağırlıklar W1 ve W2 PLUS BIAS B ile çarpılan 2 değişkenli bir çok doğrusal regresyonu belirtir. Y_HAT'u sıcaklık, ağırlık, ağırlık ve benzeri bir sıcaklık gibi dönüştürürsek, [0, 1] gibi ayrık bir ikili sayıya, iki sınıfı belirtmek için, Sigmoid işlevini Y_HAT'a uygulayabiliriz, 0.5 gibi bir eşik belirleyebiliriz. Her iki sınıf hem de tamamen işlevsel bir lojistik regresyon modelimiz var (log_reg).

log_reg = Sigmoid (y_hat) â € ¦ => Sigmoid (w1x1 + w2x2 + Â b)

Ayrıca, Sigmoid işlevini Softmax işlevine kolayca genişletebiliriz.

Softmax, çok sınıflı sınıflandırma için idealdir. Softmax'ta, her bir çıktı for sınıfı için üssü (e [y1, y2â € ¦y5] 'e yükseltilir) hesaplarız.

5 sınıfımız varsa, 5 elemanlı bir vektörümüz var, [y1, y2 ⠀ ¦Â y5]

Bu nedenle, tüm üsleri toplayıp her üsleri toplam üs toplamına böleriz. Bu, 1.0'a kadar toplam 5 farklı olasılık verir. En yüksek olasılık puanına sahip değer tahmin olur (y_hat)

https://medium.com/media/db3823da9f36a815cecf7e8a8c9d97ed/href

f (x) = 3 / (x + Â 2)

Yukarıdaki ifade, herhangi bir x girdisi için işlevin 3 / Â (x-2) değerini döndürdüğü anlamına gelir.

Öyleyse, evet, bu fonksiyonun alanını nasıl belirleyeceğiz? Başka bir deyişle, x'in hangi değerleri bu ifadeyi geçerli kılacaktır?

Başka herhangi bir kısıtlama olmaksızın, x, 2 dışında herhangi bir Gerçek sayıyı alabilmelidir. Bunun nedeni, 3 / (2 --- 2) 'nin yasa dışı olması ve bir ZeroDivisionError oluşturmasıdır.

Bu nedenle etki alanı (xÂ! = 2) veya {x | xÂ! = Â 2}.

Aralığı bulmak için, (3 / (x + 2)) = Â y özelliğine sahip etki alanında x gerçek sayısı olacak şekilde y'nin değerlerini bulmamız gerekir.

X, 2 dışında herhangi bir gerçek sayı olabileceğinden ve 3 bölü (herhangi bir gerçek sayı artı 2), Â 0'a eşit olamaz.

Bu nedenle aralık (yÂ! = 0) veya {y | yÂ! = Â 0}.

Özet

Yukarıdaki son örnek biraz aldatıcıydı, ancak kurala dayalı olarak alanın yasal öğelerini bulma konusunda aynı genel modeli izliyor. Ardından, bu öğeleri aralığına eşleyin.

Fonksiyonlar, genel olarak programlama ve özellikle de AI için son derece önemlidir. Modeller oluşturmaya, diğer birçok işleve sahip kütüphaneleri içe aktarmaya veya gerektiği gibi bizimkini yazmaya devam ederken. İşlevlerimizin alanı, kuralı ve kapsamı konusunda bilinçli olalım. Ad ve değişken adlarının kendinden açıklamalı olması dışında, her işleve insan tarafından okunabilir bir belge dizesi ekleyin.

Zaman ayırdığınız için teşekkürler.

Şerefe!

Kredi:

Python (Francois Chollet) ile derin öğrenme

Montereyinstitute.org

Openstax.org

makine öğrenimi ustalığı

Benim hakkımda:

Lawrence, Tech Layer'da bir Veri Uzmanıdır ve adil ve açıklanabilir yapay zeka ve Veri Bilimi konusunda tutkuludur. IBM'den hem Data Science Professional hem de Advanced Data Science Professional sertifikalarına sahibim. ve Udacity AI Nanodegree. ML ve DL kitaplıklarını kullanarak birkaç proje yürüttüm, mevcut kitaplıklar bol olsa bile işlevlerimi olabildiğince kodlamayı seviyorum. Son olarak, öğrenmeyi, keşfetmeyi, sertifika almayı ve deneyimlerimi anlayışlı makaleler aracılığıyla paylaşmayı asla bırakmıyorum.

Beni bulmaktan çekinmeyin: -

Github

Linkedin

Twitter.

Yapay Zekadaki İşlevleri Anlamak, ilk olarak, insanların bu hikayeyi vurgulayarak ve yanıtlayarak konuşmaya devam ettikleri Ortamda AI'ya Doğru'da yayınlandı.

AI'ya Doğru aracılığıyla yayınlandı

Kaynak: TowardsAI

More Posts