Abstract | ”Strojno učenje jest programiranje računala na način da optimiziraju neki kriterij uspješnosti temeljem podatkovnih primjera ili prethodnog iskustva” [7]. Najvažniji teorem strojnog učenja je PAC teorem koji kaže: ukoliko model radi dovoljno dobro na većini primjera, onda je vjerojatno dovoljno dobar. Model strojnog učenja trenira se na primjerima za trening, na kojima se pokušava postići optimalna prilagodba. Žele se izbjeći premala prilagodba (kada model ne radi točno ni na primjerima za treniranje) i prevelika prilagodba (kada model savršeno radi na primjerima za testiranje, ali na novim primjerima griješi). Metoda potpornih vektora, koju je šezdesetih godina prošlog stoljeća stvorio Vladimir Vapnik, nije se previše koristila sve do 1992. godine, kada su Isabelle Guyon, Bernhard Boser i Vladimir Vapnik uveli nelinearni klasifikator koristeći tzv. kernel trik. Verziju za regresiju predložili su 1997. godine Vladimir Vapnik, Harris Drucker, Chris Burges, Linda Kaufman i Alex Smola. Metoda potpornih vektora temelji se na teoriji statističkog učenja koja nastoji minimizirati rizik i kompleksnost modela. U metodi potpornih vektora spomenuto se pokušava postići pronalaskom optimalne razdvajajuće hiperravnine (one s najmanjom udaljenošću između hiperravnine i njoj najbližih primjera, potpornih vektora). U situaciji kada problem nije razdvojiv ili je vrijeme traženja optimalne hiperravnine predugo, točke se mapiraju u prostor više dimenzije od originalne što se naziva kernel trik, a preslikavanje kernel. Burza je organizirano i centralizirano mjesto trgovanja gdje prodavatelji i kupci anonimno predaju svoje ponude za prodaju, odnosno kupnju. Iz svih primljenih ponuda za prodaju i kupnju, formiraju se krivulje ponude i potražnje. Tržišna cijena i količina kojom se trguje određuju se presjekom tih dviju krivulja. Strategija trgovanja električnom energijom započinje pronalaskom modela koji što preciznije predviđa cijene električne energije i ovisi o ulozi na tržištu. U ovom radu obrađen je primjer izrade strategije trgovanja električnom energijom u Njemačkoj korištenjem metode potpornih vektora. Pritom korišteni podaci sastoje se od sljedećih značajki: satna temperatura, satna proizvodnja električne energije iz sunčevih i fotonaponskih elektrana, satna proizvodnja iz vjetroelektrana, satna proizvodnja iz konvencionalnih elektrana iznad 100 MW instalirane snage, dnevna proizvodnja električne energije iz hidroelektrana i satna energija padalina, te ciljne vrijednosti: satna cijena električne energije. Svi podaci pokazuju varijacije s više ili manje izraženim skokovima. Obrasci na godišnjoj, tjednoj i dnevnoj razini primijećeni su kod cijene električne energije, temperature, proizvodnje iz sunčevih i fotonaponskih elektrana, vjetroelektrana, te konvencionalnih elektrana. Također je primijećena veza između proizvodnje električne energije iz hidroelektrana i energije padalina. Priprema podataka i rad algoritma proveden je funkcijama i klasama programskog jezika Python. Podaci od 7. 5. do 11. 11. 2014. godine korišteni su za treniranje modela, dok je model validiran na podacima od 12. 11. do 19. 11. 2014. Najbolji rezultat postignut je modelom sa selekcijom i parametrima \(C=1400\) i \(\gamma=9.9999999999999995 e^{-03}\). Kod tog modela, postotna mjera pogreške na testnom tjednu je \(MAPE=14.14 \% \). Na temelju predviđenih podataka modela, moguće je stvoriti strategiju koja će poboljšati trgovanje. Primjer jedne strategije pokazan je u radu na predviđanjima modela za dan 12. 11. 2014. |
Abstract (english) | Machine learning is the theory of programming computers so that they optimize certain success criteria regarding data examples or previous experience [7]. The most important theorem for machine learning is the PAC theorem that says: if a model does well enough on most examples, it is probably good enough. Machine learning model is trained on training examples, in which it is tried, to achieve optimal adjustment. An attempt is made to avoid underfitting, (when the model does poorly on training examples), and overfitting, (when the model does perfectly on training examples, but makes mistakes on new examples). Support Vectors Machine was created by Vladimir Vapnih in 1960’s, but was not used until 1992, when Isabelle Guyon, Bernhard Boser and Vladimir Vapnik introduced nonlinear classifier using the kernel trick. Regression version was proposed in 1997, by Vladimir Vapnik, Harris Drucker, Chris Burges, Linda Kaufman and Alex Smola. Statistical learning theory seeks to minimize the risk and complexity of the model. Support vectors machine is based on statistical learning theory. In support vectors machine, the minimization of the risk and complexity of the model is aimed by finding optimal separating hyper plane. Optimal hyper plane is the one with smallest distance between hyper plane and support vectors. In situations when data is not separable or time to discover optimal hyper plane is too long, kernel trick is used: points are mapped to higher dimensional space than original. The marketplace is an organized and centralized place of trading, where sellers and buyers present their offers. Lines of supply and demand are created considering all received offers. Market price and quantity for trading, are determined upon intersection of the supply and demand line. Trading strategy begins by seeking a model with the most precision in predicting market price of electric energy, and it differs regarding trader role on the market. This thesis elaborates the example of the strategy development of electricity trading in Germany by using the support vectors machine. Data used are: temperature, production of electric energy from solar power plants, production of electric energy from wind power plants, production of electric energy from conventional power plants over 100 MW output power, production of electric energy from hydro power plants, energy of precipitation, and price of electric energy measured in hourly time intervals. All data have variations with extreme jumps between values. Annually, weekly and daily patterns are shown in the price of electric energy and temperature. Similar patterns are seen in the production of electric energy from solar power plants, wind power plants, and from conventional power plants. There is a distinct connection between the production of electric energy from hydro power plants, and the energy of precipitation. Functions and classes of programming language Python were used for data preparation and algorithm implementation. Data from 7. 5. to 11. 11. 2014 were used for training of model, and data from 12. 11. to 19. 11. 2014 were used for model validation. Model with selection, \(C=1400\) and \(\gamma=9.9999999999999995 e^{-03}\) gave the best results with mean absolute percentage error \(14.14 \% \). It is possible to create a strategy of electricity trading based on data produces by described model. Example of one such strategy is given in this thesis for 12. 11. 2014. |