Kezdőoldal » Számítástechnika » Programozás » Hogyan lehetne tovább optimali...

Hogyan lehetne tovább optimalizálni ezt a megoldást?

Figyelt kérdés

Az a feladat, hogy tömbben kell megkeresni a legtöbbször előforduló elemet. A nyelv igazából mindegy, Pythonban írtam, de megértek mást is.


A tömbnek ilyen tulajdonságai vannak:

- minimum 3 elemű, maximum 10 000 elemű

- az elemek a [0, tömb mérete[ intervallumból vehetnek fel értékeket, tehát 100 elemű tömbben például 0-99 elemek lehetnek, 5000 eleműben 0-4999 stb.

- mindig van jó megoldás és mindig csak egy jó megoldás van, tehát a legtöbbször előforduló elemen kívül minden más elem kevesebbszer fordul elő


Példa és megoldás:

[4, 0, 0, 3, 1] - 0 (kétszer fordul elő)

[4, 0, 9, 2, 4, 4, 9, 0, 3, 7] - 4 (háromszor fordul elő)

[1, 1, 2] - 1 (kétszer fordul elő)



A megoldásom 2 körös, első körben végig megyek a tömbön és dictben (más nyelvekben hashmap, hashtable) letárolom az elemeket az előfordulásukkal.

A második kör pedig egy maximum keresés a dictben, tehát megkeresem a legnagyobb előfordulást és visszaadom az ahhoz tartozó elemet.


Lehet ezen a megoldáson javítani valahogy?


Ha jól gondolom ez O(n) idő és O(n) tár komplexitás ebben a formában (mert minden elemen végig kell menni, a dictbe pedig legrosszabb esetben tömb mérete - 1 elem kerül).


Nem feltétlenül kódra vagyok kíváncsi, ötletekre főleg.



2020. márc. 31. 17:28
1 2 3 4
 1/33 anonim ***** válasza:
28%
Nem dictionaryben, hashmapben tárolod a darabszámokat, hanem sima tömbben. Nyilván ez több memóriát kíván (pont mint az eredeti tömböd), de azért mégiscsak gyorsabb tömböt indexelni mint hashmapben megkeresni az értéket.
2020. márc. 31. 17:35
Hasznos számodra ez a válasz?
 2/33 A kérdező kommentje:

Köszi a választ.


"Nem dictionaryben, hashmapben tárolod a darabszámokat, hanem sima tömbben. Nyilván ez több memóriát kíván"


Miért kíván nyilván több memóriát?

Ha jól tudom tömbben csak maga az érték tárolódik, dictben/hashmapben pedig a hash is, tehát azonos elemszám esetén az utóbbinak minimum 2x annyi memória kell.

Tehát ha a dict/hashmap mérete eléri a tömb felének a méretét, már egálban vannak és e fölött pedig már többet foglal a hashmap.

2020. márc. 31. 18:23
 3/33 anonim ***** válasza:
0%
O(n)-nél mit akarsz jobbat? :) Elméletileg se lehetne jobb, mert egyszer mindenképp végig kell menni a tömbön.
2020. márc. 31. 18:32
Hasznos számodra ez a válasz?
 4/33 anonim ***** válasza:
28%
Jó, akkor úgy írom, hgoy több memóriát foglalhat. Nyilván ha kevesebb féle egyedi szám van, akkor a hashmap jóval kevesebb memóriát használ.
2020. márc. 31. 18:35
Hasznos számodra ez a válasz?
 5/33 A kérdező kommentje:

#3 nem írtam sehol, hogy O(n)-nél jobb komplexitást szeretnék (bár lehet félreérthetően fogalmaztam ezek szerint?)

Viszont ha egy for ciklusban ezerszer végig mész a tömbön, az is O(n) komplexitás.

Nem jelenti azt, hogy a konstans faktoron nem lehet javítani.

2020. márc. 31. 18:40
 6/33 anonim ***** válasza:
41%

Ha az egyik elem előfordulása meghaladja a tömb hosszának felét vizsgálat közben, akkor biztos ő a legtöbbször előforduló elem.

Pl a harmadik példánál elég a második elemig vizsgálni.

2020. márc. 31. 18:56
Hasznos számodra ez a válasz?
 7/33 anonim ***** válasza:
0%
Ja, ha ilyen aprópénzért is lehajolsz, akkor dict helyett tömb jobb ilyen peremfeltételek mellett.
2020. márc. 31. 19:07
Hasznos számodra ez a válasz?
 8/33 A kérdező kommentje:

#6 nem vagyok biztos benne, hogy ez megéri.

Így ugye minden egyes elemnél +1 vizsgálatot kell végeznünk (összehasonlítani a darabszámot a tömb méretének felével).

Tehát pl. abban az esetben, ha nincs olyan elem, ami a tömb felének méretéhez képest többször fordul elő, akkor feleslegesen végeztünk n darab összehasonlítást.

De még ha van is olyan elem, n/2-szer akkor is el kell ezt a vizsgálatot végeznünk, tehát összességében talán a maximum kiválasztást lehet így megspórolni.


Mindenesetre érdemes elgondolkodni rajta, köszönöm, ment a zöld.

2020. márc. 31. 19:08
 9/33 A kérdező kommentje:
#7 tanulás céljából csinálom, így igen, ilyen aprópénzért is lehajolok.
2020. márc. 31. 19:11
 10/33 anonim ***** válasza:
50%

"az elemek a [0, tömb mérete[ intervallumból vehetnek fel értékeket"


Ez a feltétel igen hasznos, azon gondolkodj el, hogy ezt milyen formában tudnád felhasználni.


*Spoiler*

1-pass, O(n) time, O(1) space megoldás:

https://pastebin pont com/bufcrVNC

(elképzelhető, hogy 2 pass gyorsabb lenne valamivel, benchmark nélkül nem tudom megmondani)

2020. márc. 31. 19:57
Hasznos számodra ez a válasz?
1 2 3 4

Kapcsolódó kérdések:





Minden jog fenntartva © 2024, www.gyakorikerdesek.hu
GYIK | Szabályzat | Jogi nyilatkozat | Adatvédelem | Cookie beállítások | WebMinute Kft. | Facebook | Kapcsolat: info(kukac)gyakorikerdesek.hu

A weboldalon megjelenő anyagok nem minősülnek szerkesztői tartalomnak, előzetes ellenőrzésen nem esnek át, az üzemeltető véleményét nem tükrözik.
Ha kifogással szeretne élni valamely tartalommal kapcsolatban, kérjük jelezze e-mailes elérhetőségünkön!