Sunday, 26 November 2017

Różnica między regresem ruchomym a regresem liniowym


Jakie są zależności i różnice między szeregami czasowymi a regresją Dla modeli i założeń. czy to prawda, że ​​modele regresji przyjmują niezależność między zmiennymi wyjściowymi dla różnych wartości zmiennej wejściowej, podczas gdy model szeregów czasowych nie. Jakie są inne różnice Istnieje wiele podejść do analizy szeregów czasowych, ale dwie najbardziej znane to: metoda regresji i metoda Box-Jenkins (1976) lub ARIMA (automatyczna automatyczna redukcja ruchów). Ten dokument wprowadza metodę regresji. Uważam, że metoda regresji znacznie przewyższa metodę ARIMA z trzech głównych powodów. Nie bardzo rozumiem, jaka metoda regresji dla szeregów czasowych znajduje się na stronie internetowej i jak różni się ona od metody Box-Jenkins lub ARIMA. Doceniam, że ktoś może dać wgląd w te pytania. Dzięki i pozdrawiam Naprawdę uważam, że to dobre pytanie i zasługuje na odpowiedź. Podany link jest napisany przez psychologa, który twierdzi, że niektóre metody home-brew to lepszy sposób na analizę szeregów czasowych niż Box-Jenkins. Mam nadzieję, że moja próba odpowiedzi zachęci innych, którzy mają większą wiedzę na temat szeregów czasowych, do wniesienia swojego wkładu. Po jego wprowadzeniu wygląda na to, że Darlington promuje podejście polegające na dopasowaniu modelu AR do najmniejszych kwadratów. Oznacza to, że jeśli chcesz dopasować model zt alpha1 z cdots alphak z varepsilont do serii czasowej zt, możesz po prostu cofnąć serię zt w serii z opóźnieniem 1, opóźnieniem 2 i tak dalej aż do opóźnienia k, używając zwykła wielokrotna regresja. Z pewnością jest to dozwolone w R, nawet opcja w funkcji ar. Przetestowałem go i daje on podobne odpowiedzi do domyślnej metody dopasowywania modelu AR do R. Popiera również regresję zt na takie rzeczy jak t lub moce t, aby znaleźć trendy. Ponownie, jest to absolutnie w porządku. Wiele książek z serii czasowych to omawia, na przykład Shumway-Stoffer i Cowpertwait-Metcalfe. Zazwyczaj analiza szeregu czasowego może przebiegać wzdłuż następujących linii: znajdziesz trend, usuniesz go, a następnie dopasujesz model do reszty. Wygląda jednak na to, że jest on również zwolennikiem nadmiernego dopasowania, a następnie wykorzystania redukcji błędu średniego kwadratu między dopasowanymi seriami a danymi jako dowodu, że jego metoda jest lepsza. Na przykład: Czuję, że korelogramy są przestarzałe. Ich głównym celem było umożliwienie pracownikom odgadnięcia, które modele najlepiej pasują do danych, ale szybkość nowoczesnych komputerów (przynajmniej w przypadku regresji, jeśli nie w dopasowaniu modelu szeregów czasowych), pozwala pracownikowi po prostu dopasować kilka modeli i zobaczyć dokładnie, w jaki sposób każdy pasuje mierzony średnim kwadratem błędu. Kwestia kapitalizacji przypadkowej nie ma związku z tym wyborem, ponieważ obie metody są równie podatne na ten problem. To nie jest dobry pomysł, ponieważ test modelu ma być taki, jak dobrze może on prognozować, a nie jak dobrze pasuje do istniejących danych. W jego trzech przykładach używa on skorygowanego błędu średniej kwadratowej jako kryterium jakości dopasowania. Oczywiście, przepasanie modelu spowoduje, że oszacowanie błędu w próbce będzie mniejsze, więc jego twierdzenie, że jego modele są lepsze, ponieważ mają mniejszy RMSE, jest błędne. Krótko mówiąc, ponieważ używa niewłaściwego kryterium do oceny, jak dobry jest model, wyciąga błędne wnioski na temat regresji przeciwko ARIMA. Zakładam się, że gdyby przetestował zdolność predykcyjną modeli, ARIMA wyszedłby na wierzch. Być może ktoś może go wypróbować, jeśli ma dostęp do książek, które wymienia tutaj. Uzupełniające: aby uzyskać więcej informacji na temat pomysłu regresji, warto zapoznać się ze starszymi książkami z serii czasowych, które zostały napisane zanim ARIMA stała się najpopularniejsza. Na przykład Kendall, Time-Series. 1973, Rozdział 11 zawiera cały rozdział dotyczący tej metody i porównań z ARIMA. O ile wiem, autor nigdy nie opisał swojej metody home-brew w recenzowanej publikacji, a odniesienia do literatury statystycznej i z niej są minimalne, a jego główne publikacje dotyczące tematów metodologicznych pochodzą z lat 70-tych. Ściśle mówiąc, nic z tego nie dowodzi niczego, ale bez wystarczającej ilości czasu lub wiedzy, aby samodzielnie ocenić te twierdzenia, byłbym bardzo niechętny do skorzystania z tego. ndash Gala Jul 18 13 at 11: 31 Funkcja Różnica z ruchomej średniej (Szeregi czasowe) oblicza różnicę między wartością a średnią kroczącą szeregu czasowego. Parametry ------------------ Dane Dane do analizy. Jest to zwykle pole w serii danych lub obliczona wartość. Okres Liczba pasków danych do uwzględnienia w średniej, w tym bieżącej wartości. Na przykład okres 3 zawiera bieżącą wartość i dwie poprzednie wartości. Wartość funkcji ------------------------ Średnia ruchowa serii czasowych jest obliczana przez dopasowanie liniowej linii regresji ponad wartościami dla danego okresu, a następnie określenie bieżąca wartość dla tej linii. Linia regresji liniowej jest linią prostą, która jest możliwie najbliżej wszystkich podanych wartości. Średnia krocząca szeregu czasowego na początku serii danych nie jest zdefiniowana, dopóki nie będzie wystarczających wartości do wypełnienia danego okresu. Zwróć uwagę, że średnia ruchoma szeregów czasowych różni się znacznie od innych typów ruchomych średnich, ponieważ aktualna wartość jest zgodna z ostatnią tendencją danych, a nie faktyczną średnią danych. Z tego powodu wartość tej funkcji może być większa lub mniejsza niż wszystkie wartości używane, jeśli tendencja danych ogólnie rośnie lub maleje. Różnica od średniej ruchomej to średnia ruchoma odejmowana od wartości bieżącej. Wykorzystanie ----------- Średnie kroczące są przydatne do wygładzenia hałaśliwych nieprzetworzonych danych, takich jak ceny dzienne. Dane dotyczące cen mogą się znacznie różnić w zależności od dnia, co powoduje, że cena rośnie lub spada z upływem czasu. Patrząc na ruchomą średnią cenę, można zobaczyć bardziej ogólny obraz podstawowych tendencji. Ponieważ średnie ruchome można wykorzystać do obserwowania trendów, można je również wykorzystać do sprawdzenia, czy dane nie są zgodne z trendem. Różni się to od średniej ruchomej przydatnej do wyróżnienia, gdzie dane się odrywają od trend. mike, najpierw instalują R (jeśli jeszcze nie), uruchamiaj R i instaluj pakiet TeachingDemos (dokładnie jak zależy od twojego systemu), załaduj pakiet z biblioteką (TeachingDemos), następnie wpisz loess. demo, aby wyświetlić stronę pomocy, aby zobaczyć, jak go uruchomić, możesz przewinąć do dołu, gdzie znajduje się przykład, i skopiuj i wklej ten kod do wiersza poleceń R39s, aby zobaczyć przykłady , następnie uruchom z własnymi danymi, aby dalej eksplorować. ndash Greg Snow Mar 23 12 o 17:15 Oto prosta, ale szczegółowa odpowiedź. Model liniowy pasuje do relacji poprzez wszystkie punkty danych. Ten model może być pierwszym rzędem (innym znaczeniem liniowym) lub wielomianem, aby uwzględnić krzywiznę, lub z wypustami, aby uwzględnić różne regiony mające inny model rządzenia. Dopasowanie LOESS to lokalnie przenoszona regresja ważona oparta na oryginalnych punktach danych. Co oznacza dopasowanie A LOESS, wpisuje oryginalne wartości X i Y, a także zestaw wyjściowych wartości X, dla których należy obliczyć nowe wartości Y (zazwyczaj te same wartości X są używane dla obu, ale często mniej wartości X są używane dla dopasowanych par XY ze względu na wymagane wyższe obliczenia). Dla każdej wyjściowej wartości X część danych wejściowych jest wykorzystywana do obliczenia dopasowania. Część danych, zwykle od 25 do 100, ale zazwyczaj 33 lub 50, jest lokalna, co oznacza, że ​​jest to część oryginalnych danych najbliżej każdej konkretnej wartości wyjściowej X. Jest to ruchome dopasowanie, ponieważ każda wyjściowa wartość X wymaga innego podzestawu oryginalnych danych, o różnych masach (patrz następny akapit). Ten podzbiór wejściowych punktów danych służy do wykonywania ważonej regresji, z punktami najbliższymi wartości wyjściowej X o większej wadze. Ta regresja jest zwykle możliwa w przypadku pierwszego rzędu lub wyższej, ale wymaga większej mocy obliczeniowej. Wartość Y tej ważonej regresji obliczonej na wyjściu X jest używana jako wartość Y modelu dla tej wartości X. Regresja jest przeliczana przy każdej wartości wyjściowej X, aby wytworzyć pełny zestaw wyjściowych wartości Y. odpowiedź 21 lutego 15 o 21:08

No comments:

Post a Comment