Abstract | U današnjem svijetu slobodnog tržišta prednost osiguratelja je naplaćivanje premije razmjerne riziku koji osiguratelj preuzima na sebe. Zbog toga je izrada premijskog sustava jedan od najvažniji poslovnih procesa osiguratelja. Obzirom da tržište sve više zahtjeva individualizaciju premije, osiguratelji se sve više odmiču od jednostavnih izračuna poput prosječne premije i priklanjaju se sve kompliciranijim statističkim modelima pomoću kojih pokušavaju objasniti kako frekvencija šteta ili prosječna šteta ovise o kovarijatama, tj. faktorima za izračun premije. U zadnje vrijeme najvažniji statistički modeli koji se koriste u tu svrhu su generalizirani linearni modeli (GLM). Oni predstavljaju poopćenje linearnog modela u dva smjera. Umjesto pretpostavke o normalnoj distribuciji, GLM koristi eksponencijalnu familiju distribucija. Osim toga, u GLM-u je bilo koja monotona transformacija očekivanja linearna funkcija kovarijata. Glavna prednost GLM-a je mogućnost korištenja dobro razvijenih statističkih metoda, kao što su procjene grešaka, intervali pouzdanosti, statistički testovi i slično. Osim toga, važna prednost GLM-a je što postoji mnogo standardnih softverskih rješenja koja su svima dostupna, a koja uključuju sve što je potrebno da dobru analizu podataka i modeliranje GLM-a. Na početku ovog rada definiraju se osnovni pojmovi i objašnjavaju razlozi korištenja multiplikativnog modela koji se specijalni slučaj GLM-a. Nakon toga se definiraju generalizirani linearni modeli i eksponencijalna familija distribucija. Posebno se promatraju distribucije frekvencije šteta i prosječne štete te definiraju Tweediejevi modeli koji su jedini modeli iz eksponencijalne familije zatvoreni na množenje s konstantom. Nakon definiranja i druge sastavnice GLM-a, funkcije veze, u ovom radu daje se i procjena parametara modela metodom maksimalne vjerodostojnosti. Nadalje, uvode se devijanca i AIC kriterij kao mjere koliko je model dobar, te razne testne statistike pomoću kojih možemo provoditi statističke testove i izračunati intervale pouzdanosti za parametre. Na samom kraju prikazan je primjer izračuna koeficijenata korekcije premije pomoću GLM modela za frekvenciju šteta i prosječnu štetu u programskom jeziku R. |
Abstract (english) | In today's free-market insurer's advantage is charging a premium proportional to the risk that the insurer's takes. Therefore, the production of tariff is one of the most important business processes for insurer. As the market increasingly demands individualization of premiums, insurers are increasingly moving away from simple calculations such as average premiums and defer to increasingly complicated statistical models in an attempt to explain how the claim frequency or claim severity depends on the covariates, i.e. rating factors. Lately most important statistical models used for this purpose are generalized linear models (GLM). They represent a generalization of linear models in two directions. Instead of assuming the normal distribution, GLM uses exponential dispersion models. Furthermore, in GLMs any monotone transformation of the mean is a linear function of covariates. The main advantage of the GLM is a possibility to use a well-developed statistical methods, such as estimating standard errors, constructing confidence intervals, statistical testing and other statistical features. In addition, an important advantage of the GLM is that there is a lot of standard software solutions that are available to everyone, which include everything needed for good data analysis and modeling of GLM's. In the beginning of this thesis, we define the basic terms and explain the reasons for using the multiplicative model, which is a special case of GLM. Then we define the generalized linear models and exponential dispersion models. In particular, distribution of the claim frequency and the claim severity is observed and Tweedie models are defined, the only exponential dispersion models that are scale invariant. After defining of second component of the GLM, the link function, in this paper we give parameter estimation using maximum likelihood method. Furthermore, deviance and AIC criterion are introduced as measure of model fit, and a variety of test statistics with which we can carry out statistical tests and calculate confidence intervals for the parameters. At the very end we give an example of calculating the relativities in the tariff by GLM model for the claim frequency and the claim severity in the programming language R. |