Kezdőoldal » Számítástechnika » Programozás » Szerintetek az alábbi feladat...

Szerintetek az alábbi feladat megoldásához mely algoritmust / algoritmusokat célszerű használni?

Figyelt kérdés

Sziasztok! 🙂 Röviden magamról: 23 éves biológus MSc hallgató lány vagyok a diplomamunkám algavirágzási periódusok karakterisztikáinak előrejelzése óceáni környezetben történő nitrogén és foszfátkoncentráció változás révén.


Nagyon-nagyon röviden és sarkítottan a témáról: rendelkezem idősoros adatokkal különböző álló-bólyák és szenzorokról, amik mérik az említett paramétereket (nitrogén / foszfátkoncentráció). Ha hirtelen emelkedés következik be ezekben az értékekben akkor következtethetünk adott szignifikancia-szint felett meghatározott konfidencia-intervallum mellett algavirágzásról.


Kérdésem az alábbi aki jártasabb statisztikából / adattudomány területen: ti elsősorban milyen algoritmust tesztelnétek olyan esetben ha idősoros mérések alapján, nagyobb kilengésekből próbálnátok megbecsülni az algavirágzást és annak intenzitását (pl: gyenge, közepes, erős)? Rendelkezem több évtizedes mérési adatokkal több állomásról is, valamint tengerbiológusok által validált adatsorral az algavirágzás dátumára és erősségére vonatkozóan, úgyhogy supervised learning alapú modellt is használhatok akár.


1000 hála előre is a javaslatokért! ☺️



ápr. 29. 21:32
 1/4 anonim ***** válasza:
61%

Ha itt nem kapnál választ, akkor redditen az r/programminghungary-ben tedd fel mindenképp, ott több szakember van. Tudom ez most nem segítség hirtelen, de ez túl specifikus kérdés.


Még esetleg tudom ajánlani a tudományok kategóriát, ott talán nagyobb eséllyel kapsz erre választ.

ápr. 30. 00:09
Hasznos számodra ez a válasz?
 2/4 anonim ***** válasza:
45%

Az egyik lehetőség az ARIMA (AutoRegressive Integrated Moving Average) lenne. Az ARIMA képes modellezni az idősorokban lévő trendeket, szezonális ingadozásokat, stacionaritást.


Persze lehet, hogy jobban körül nézve akadna más, probléma-specifikusabb lehetőség is, de én nem vok adattudós.

ápr. 30. 01:10
Hasznos számodra ez a válasz?
 3/4 Szikszai.B ***** válasza:
0%

"algavirágzási periódusok karakterisztikáinak előrejelzése óceáni környezetben történő nitrogén és foszfátkoncentráció változás révén"


Hát ez borzasztó izgalmasan hangzik :D

ápr. 30. 08:27
Hasznos számodra ez a válasz?
 4/4 anonim ***** válasza:

Szerintem izgalmas téma. Bár én programozó vagyok, nem biológus, az utolsó 3 projectem mind biológiai témájú volt (az elsőnél kajakosok teljesítményét mértük, a másodiknál neuronok elektromos aktivitását, a harmadiknál stroke pácienseknek fejlesztettünk rehabilitációs robotot).

A domain tudás egyes esetekben sokat számít (pl. miért pont a nitrogén és foszfát kell), de nem elég. A data témába most tanulok bele, de már így is látom, hogy a konkrét adatok nélkül nem lehet megmondani milyen algoritmus fog kelleni. Ha kevés adat van, a sok tanulóadatot igénylő algoritmusok (pl. NN) nem fog menni, de ezen túl nem nagyon lehet megmondani mi fog működni. Vannak rá libek, többet le kell futtatni - ami paraméterezhetó, ott több paraméterezéssel.

Lehetnek az általános algoritmusok helyett domain-specifikusak is, ahogy korábban már említették. A neuronos projectnél a spike detekcónál pl. azt csináltam, hogy ahelyett, hogy sajátot találtam volna ki rá, megkérdeztem a főnökömet, hogy ezt hogy szokták, ő adott egy publikációt, és azt implementáltam. Szóval érdemes először átnézni a létező kutatásokat, hogy mi működött és mi nem. Felteszem, ebben az esetben inkább az utóbbiból fogsz találni, különben ki sem írták volna ezt a diplomamunka témát.

Az adatok idősoros jellege miatt az is elképzelhető, hogy más domainben, de szintén idősoros adatokat használó területen lesz jó algoritmus. Mondjuk algavirágzással a világon relatíve kevés ember foglalkozik, de pl. tőzsdei árfolyamok előrejelzésével többen, és az is idősoros adaton megy. Könnyen el tudom képzelni, hogy lesz egy olyan indikátor, ami pont jó neked.

Az adatok egyébként elérhetőek? Mert minden azon múlik, az milyen minőségű. Mit lehet tudni a folyamat biológiai hátteréről? Ezeket az értékeket befolyásolja más is az algán kívül? Mennyi adatod van? A "több évtizedes" lehet sok vagy kevés is pl. neurális hálóhoz vagy random foresthez, de kb. 15 éve még a support vector machine is népszerű volt. Ha tudod, hogy hol vannak a mérőberendezések, esetleg a historikus időjárási adatokat is érdemes mellé letölteni, valószínűleg hatással van rá. Konzulensed mit mondott, volt ötlete, hogy kezdj neki?

máj. 4. 09:42
Hasznos számodra ez a válasz?

Kapcsolódó kérdések:





Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!