Wednesday 13 December 2017

Przenoszenie średnio danych analiza excel


Średnia ruchoma Ten przykład pokazuje, jak obliczyć średnią ruchomą szeregu czasowego w Excelu. Średnia ruchoma służy do łagodzenia nieprawidłowości (szczytów i dolin) w celu łatwego rozpoznawania trendów. 1. Najpierw przyjrzyjmy się naszej serii czasowej. 2. Na karcie Dane kliknij Analiza danych. Uwaga: nie można znaleźć przycisku Analiza danych Kliknij tutaj, aby załadować dodatek Analysis ToolPak. 3. Wybierz średnią ruchomą i kliknij OK. 4. Kliknij pole Input Range i wybierz zakres B2: M2. 5. Kliknij w polu Interwał i wpisz 6. 6. Kliknij pole Zakres wyjściowy i wybierz komórkę B3. 8. Narysuj wykres tych wartości. Objaśnienie: ponieważ ustawiliśmy przedział na 6, średnia ruchoma jest średnią z poprzednich 5 punktów danych i bieżącego punktu danych. W rezultacie szczyty i doliny są wygładzone. Wykres pokazuje rosnący trend. Program Excel nie może obliczyć średniej ruchomej dla pierwszych 5 punktów danych, ponieważ nie ma wystarczającej liczby poprzednich punktów danych. 9. Powtórz kroki od 2 do 8 dla przedziału 2 i odstępu 4. Wniosek: Im większy przedział, tym bardziej wygładzone są szczyty i doliny. Im mniejszy przedział czasu, tym bardziej zbliżone są średnie ruchome do rzeczywistych punktów danych. Eva Goldwater Biostatistics Consulting Center University of Massachusetts School of Public Health zaktualizowano w lutym 2007 r. W skrócie Użyliśmy Excela do wykonania podstawowych zadań analizy danych, aby sprawdzić, czy jest rozsądną alternatywą dla używania pakietu statystycznego do tych samych zadań. Doszliśmy do wniosku, że program Excel to kiepski wybór do analizy statystycznej wykraczającej poza przykłady podręczników, najprostsze statystyki opisowe lub więcej niż kilka kolumn. Napotkane problemy, które doprowadziły do ​​tego wniosku, dotyczą czterech ogólnych obszarów: brakujące wartości są obsługiwane niespójnie, a czasami niepoprawnie. Organizacja danych różni się w zależności od analizy, co zmusza do reorganizacji danych na wiele sposobów, jeśli chcesz wykonać wiele różnych analiz. Wiele analiz można wykonać tylko w jednej kolumnie na raz, co sprawia, że ​​wykonanie tej samej analizy na wielu kolumnach jest niewygodne. Wynik jest źle zorganizowany, czasami nieodpowiednio oznakowany i nie ma zapisów dotyczących sposobu przeprowadzenia analizy. Excel jest wygodny do wprowadzania danych i szybkiego manipulowania wierszami i kolumnami przed analizą statystyczną. Jednak gdy jesteś gotowy na analizę statystyczną, zalecamy użycie pakietu statystycznego, takiego jak SAS, SPSS, Stata, Systat lub Minitab. Wprowadzenie Excel jest prawdopodobnie najczęściej używanym arkuszem kalkulacyjnym na komputery PC. Nowo zakupione komputery często są dostarczane z już załadowanym programem Excel. Łatwo można go używać do wykonywania różnych obliczeń, obejmuje zbiór funkcji statystycznych i zestaw narzędzi do analizy danych. W rezultacie, jeśli nagle zauważysz, że musisz wykonać analizę statystyczną, możesz uznać to za oczywisty wybór. Postanowiliśmy zrobić kilka testów, aby sprawdzić, jak dobrze Excel będzie służył jako aplikacja do analizy danych. Aby przedstawić wyniki, użyjemy małego przykładu. Dane dla tego przykładu są fikcyjne. Wybrano dwie zmienne kategoryczne i dwie ciągłe, abyśmy mogli przetestować różne podstawowe techniki statystyczne. Ponieważ prawie wszystkie prawdziwe zestawy danych mają co najmniej kilka brakujących punktów danych, a ponieważ umiejętność poprawnego radzenia sobie z brakującymi danymi jest jedną z funkcji, które przyjmujemy za pewnik w pakiecie analizy statystycznej, wprowadziliśmy dwie puste komórki w danych: Każdy wiersz arkusza kalkulacyjnego reprezentuje podmiot. Pierwszy pacjent otrzymał Leczenie 1 i uzyskał Wynik 1. Wartości X i Y są wartościami dwóch pomiarów na każdym osobniku. Nie byliśmy w stanie uzyskać pomiaru Y dla drugiego pacjenta lub X dla ostatniego pacjenta, więc te komórki są puste. Tematy są wprowadzane w kolejności, w której dane stały się dostępne, więc dane nie są uporządkowane w żaden szczególny sposób. Wykorzystaliśmy te dane do wykonania prostych analiz i porównaliśmy wyniki ze standardowym pakietem statystycznym. Porównanie uwzględniało dokładność wyników, a także łatwość, z jaką interfejs mógł być używany w przypadku większych zbiorów danych - tj. Więcej kolumn. Użyliśmy SPSS jako standardu, chociaż każdy z pakietów statystycznych obsługiwanych przez OIT zrobiłby to równie dobrze w tym celu. W tym artykule, gdy mówimy o pakiecie statystycznym kwot, mamy na myśli SPSS, SAS, STATA, SYSTAT lub Minitab. Większość procedur statystycznych Excela jest częścią pakietu narzędzi do analizy danych, który znajduje się w menu Narzędzia. Obejmuje on szereg opcji, w tym proste statystyki opisowe, testy t, korelacje, 1 lub 2-drożną analizę wariancji, regresji itd. Jeśli nie masz elementu analizy danych w menu Narzędzia, musisz zainstalować Dane Analysis ToolPak. Wyszukaj w Pomocy dla Narzędzia do analizy danych z zapytania, aby uzyskać instrukcje dotyczące ładowania ToolPak. Dwie inne funkcje programu Excel są przydatne w przypadku niektórych analiz, ale pakiet narzędzi do analizy danych jest jedynym, który zapewnia sensownie kompletne testy istotności statystycznej. Tabela przestawna w menu Dane może być używana do generowania tabel podsumowań średnich, odchyleń standardowych, zliczeń itp. Można również użyć funkcji do wygenerowania pewnych miar statystycznych, takich jak współczynnik korelacji. Funkcje generują pojedynczą liczbę, więc przy użyciu funkcji najprawdopodobniej będziesz musiał łączyć bity i kawałki, aby uzyskać to, czego chcesz. Mimo to możesz nie być w stanie wygenerować wszystkich części, których potrzebujesz do pełnej analizy. O ile nie zaznaczono inaczej, wszystkie testy statystyczne z wykorzystaniem Excela zostały wykonane przy użyciu narzędzia Data Analysis ToolPak. Aby sprawdzić różne testy statystyczne, wybraliśmy następujące zadania: Uzyskaj średnie i odchylenia standardowe dla X i Y dla całej grupy i dla każdej grupy leczenia. Uzyskaj korelację między X i Y. Wykonaj test t próbny na dwie próbki, aby sprawdzić, czy dwie grupy traktowania różnią się w X i Y. Wykonaj sparowany test t, aby sprawdzić, czy X i Y są statystycznie różne od siebie. Porównaj liczbę osobników z każdym wynikiem przez grupę leczenia, stosując test chi-kwadrat. Wszystkie te zadania są rutynowe dla zestawu danych tego rodzaju, a wszystkie z nich można łatwo wykonać przy użyciu dowolnego z pakietów statystycznych wymienionych na liście. Zagadnienia ogólne Włącz zestaw narzędzi do analizy Zestaw narzędzi do analizy danych nie jest instalowany ze standardową konfiguracją programu Excel. Spójrz w menu Narzędzia. Jeśli nie masz elementu analizy danych, musisz zainstalować narzędzia analizy danych. Wyszukaj w Pomocy narzędzia analizy danych quotquo, aby uzyskać instrukcje. Brakujące wartości Pusta komórka to jedyny sposób, w jaki program Excel radzi sobie z brakującymi danymi. Jeśli masz inne kody brakujących wartości, będziesz musiał zmienić je na puste. Rozmieszczenie danych Różne analizy wymagają ułożenia danych na różne sposoby. Jeśli planujesz wiele różnych testów, może nie być jednej umowy, która zadziała. Prawdopodobnie będziesz musiał zmienić rozmieszczenie danych na kilka sposobów, aby uzyskać wszystko, czego potrzebujesz. Okna dialogowe Wybierz Narzędzia Analiza danych i wybierz rodzaj analizy, którą chcesz wykonać. Typowe okno dialogowe będzie zawierało następujące elementy: Zakres wejściowy: Wpisz komórki z lewego górnego i prawego dolnego rogu. na przykład A1: B100. Możesz wybrać tylko sąsiadujące wiersze i kolumny. O ile nie ma pola wyboru do grupowania danych według wierszy lub kolumn (i zazwyczaj nie ma takich danych), wszystkie dane są traktowane jako jeden ruch. Etykiety - czasami można zaznaczyć pole, które wskazuje, że pierwszy wiersz arkusza zawiera etykiety. Jeśli masz etykiety w pierwszym rzędzie, zaznacz to pole, a twoje dane wyjściowe MOGĄ być oznaczone etykietą. Z drugiej strony może nie. Położenie wyjściowe - domyślnie jest nowy arkusz. Lub wpisz adres komórki w lewym górnym rogu miejsca, w którym chcesz umieścić dane wyjściowe w bieżącym arkuszu. Nowy arkusz roboczy to kolejna opcja, której nie próbowałem. Rozgałęzienia tego wyboru omówiono poniżej. Inne elementy, w zależności od analizy. Położenie wyjściowe Dane wyjściowe z każdej analizy mogą zostać przesłane do nowego arkusza w bieżącym pliku Excela (jest to ustawienie domyślne) lub można umieścić je w bieżącym arkuszu, określając komórkę lewego górnego rogu w miejscu, w którym ma ona być umieszczona. Tak czy inaczej jest trochę uciążliwe. Jeśli każde wyjście jest w nowym arkuszu, otrzymujesz wiele arkuszy, z których każdy ma niewielki fragment wyniku. Jeśli umieścisz je w bieżącym arkuszu, musisz umieścić je odpowiednio zostawiając miejsce na dodawanie komentarzy, a zmiany etykiety, które musisz wprowadzić, aby poprawnie sformatować jeden wynik, mogą negatywnie wpłynąć na inny wynik. Przykład: Dane wyjściowe ze strony opisowej mają kolumnę z etykietami, na przykład Odchylenie standardowe, Błąd standardowy itp. Aby ta etykieta mogła być czytana, należy ją rozłożyć na całą szerokość. Ale jeśli proste wyjście częstotliwości jest tuż pod spodem, wtedy kolumna wyświetlająca wartości, które są liczone, która może zawierać małe liczby całkowite, również będzie szeroka. Wyniki analiz Statystyki opisowe Najszybszym sposobem uzyskania średnich i odchyleń standardowych dla całej grupy jest użycie opcji Opis w narzędziach do analizy danych. Możesz wybrać kilka sąsiednich kolumn dla zakresu wejściowego (w tym przypadku kolumn X i Y), a każda kolumna jest analizowana osobno. Etykiety w pierwszym rzędzie służą do oznaczania danych wyjściowych, a puste komórki są ignorowane. Jeśli masz więcej nieprzylegających kolumn, które musisz przeanalizować, będziesz musiał powtórzyć proces dla każdej grupy sąsiednich kolumn. Procedura jest prosta, może wydajnie zarządzać wieloma kolumnami, a puste komórki są traktowane poprawnie. Aby uzyskać średnie i standardowe odchylenia X i Y dla każdej grupy leczenia, należy użyć tabel przestawnych (chyba że chcesz zmienić arkusz danych, aby oddzielić dwie grupy). Po wybraniu (ciągłego) zakresu danych, w opcji Układ wizardów tabeli przestawnej, przeciągnij Traktowanie do obszaru zmiennej Wiersz, a X do obszaru Dane. Kliknij dwukrotnie LdquoCount of Xrdquo w obszarze danych i zmień go na Average. Ponownie przeciągnij X do pola danych, a tym razem zmień liczbę na StdDev. Na koniec przeciągnij X jeszcze raz, pozostawiając go jako Liczbę X. To da nam Średnie, odchylenie standardowe i liczbę obserwacji w każdej grupie leczenia dla X. Zrób to samo dla Y, więc otrzymamy średnią, standardową odchylenie i liczba obserwacji dla Y również. Spowoduje to umieszczenie w sumie sześciu pozycji w polu Data (trzy dla X i trzy dla Y). Jak widać, jeśli chcesz uzyskać wiele statystyk opisowych dla wielu zmiennych, proces ten będzie nudny. Pakiet statystyczny pozwala wybrać dowolną liczbę zmiennych do statystyk opisowych, niezależnie od tego, czy są one przylegające. Możesz otrzymać statystyki opisowe dla wszystkich przedmiotów razem lub z podziałem na zmienne kategoryczne, takie jak leczenie. Możesz wybrać statystyki, które chcesz zobaczyć raz, i będzie ono dotyczyło wszystkich wybranych zmiennych. Korelacje Używając narzędzi do analizy danych, okno dialogowe dla korelacji jest podobne do tego, które jest dla opisów - możesz wybrać kilka sąsiednich kolumn i uzyskać macierz wyjściową wszystkich par korelacji. Puste komórki są odpowiednio ignorowane. Dane wyjściowe NIE zawierają liczby par punktów danych używanych do obliczenia każdej korelacji (które mogą się różnić w zależności od tego, gdzie brakuje brakujących danych) i nie wskazują, czy którakolwiek z korelacji jest statystycznie istotna. Jeśli chcesz korelować w kolumnach, które nie sąsiadują, musisz uwzględnić kolumny pośrednie lub skopiować wybrane kolumny do sąsiedniej lokalizacji. Pakiet statystyczny pozwoliłby wybrać nieciągłe kolumny dla twoich korelacji. Dane wyjściowe wskazują, ile par punktów danych zostało wykorzystanych do obliczenia każdej korelacji i które korelacje są statystycznie istotne. Test z dwiema próbami Test można wykorzystać do sprawdzenia, czy obie grupy leczenia różnią się wartościami X lub Y. Aby wykonać test, należy wprowadzić zakres komórek dla każdej grupy. Ponieważ dane nie zostały wprowadzone przez grupę leczenia, najpierw musimy posortować rzędy według leczenia. Pamiętaj, aby wziąć wszystkie pozostałe kolumny wraz z leczeniem, aby dane dla każdego przedmiotu pozostały nienaruszone. Po posortowaniu danych można wprowadzić zakres komórek zawierających pomiary X dla każdego zabiegu. Nie dołączaj wiersza z etykietami, ponieważ druga grupa nie ma wiersza etykiety. Dlatego twoje dane wyjściowe nie będą oznaczone, aby wskazać, że to wyjście jest dla X. Jeśli chcesz, aby dane wyjściowe były oznaczone, musisz skopiować komórki odpowiadające drugiej grupie do oddzielnej kolumny i wprowadzić wiersz z etykietą dla drugiej grupy . Jeśli chcesz również wykonać test t dla pomiarów Y, musisz powtórzyć proces. Puste komórki są ignorowane i inne niż problemy z etykietowaniem wyniku, wyniki są poprawne. Pakiet statystyczny wykona to zadanie bez konieczności sortowania danych lub kopiowania ich do innej kolumny, a wyniki będą zawsze poprawnie etykietowane w zakresie, w jakim podajesz etykiety dla zmiennych i grup leczenia. Pozwoli to również wybrać więcej niż jedną zmienną jednocześnie dla testu t (np. X i Y). Sparowany test t-Studenta Sparowany test t-testowy jest metodą sprawdzającą, czy różnica między dwoma pomiarami na tym samym obiekcie jest znacząco różna od 0. W tym przykładzie chcemy przetestować różnicę między X i Y zmierzoną na tym samym przedmiocie. Ważną cechą tego testu jest to, że porównuje on pomiary z każdym obiektem. Jeśli skanujesz kolumny X i Y osobno, nie wyglądają one oczywiście inaczej. Ale jeśli spojrzysz na każdą parę X-Y, zauważysz, że w każdym przypadku X jest większa niż Y. Sparowany test t powinien być wrażliwy na tę różnicę. W dwóch przypadkach, gdy brakuje X lub Y, nie ma możliwości porównania dwóch miar na temat. W związku z tym, tylko 8 rzędów jest użytecznych dla sparowanego t-testu. Po uruchomieniu sparowanego testu t dla tych danych, uzyskasz statystkę t 0,09, z prawdopodobieństwem 2-końcowym wynoszącym 0,93. Test nie znajduje żadnej znaczącej różnicy między X i Y. Patrząc na wynik dokładniej, zauważamy, że jest tam 9 obserwacji. Jak wspomniano powyżej, powinno być tylko 8. Wydaje się, że Excel nie wykluczył obserwacji, które nie miały zarówno pomiarów X, jak i Y. Aby uzyskać poprawne wyniki, skopiuj X i Y do dwóch nowych kolumn i usuń dane z komórek, które nie mają wartości dla drugiego taktu. Teraz ponownie uruchom sparowany test t-Studenta. Tym razem statystyka t wynosi 6.14817 z prawdopodobieństwem 2-końcowym wynoszącym 0,000468. Wniosek jest zupełnie inny Oczywiście, jest to skrajny przykład. Ale chodzi o to, że Excel nie oblicza prawidłowo sparowanego t-testu, gdy niektóre obserwacje mają jeden z pomiarów, ale nie drugi. Chociaż możliwe jest uzyskanie poprawnego wyniku, nie ma powodu, aby podejrzewać wyniki, chyba że jesteś wystarczająco czujny, aby zauważyć, że liczba obserwacji jest błędna. W pomocy online nie ma nic, co mogłoby Cię ostrzec przed tym problemem. Co ciekawe, istnieje również funkcja TTEST, która podaje poprawne wyniki dla tego przykładu. Wygląda na to, że funkcje i narzędzia analizy danych nie są spójne w sposobie radzenia sobie z brakującymi komórkami. Niemniej jednak nie mogę zalecać używania funkcji przed narzędziami do analizy danych, ponieważ wynikiem użycia funkcji jest jedna liczba - w tym przypadku prawdopodobieństwo 2-końcowej statystyki t. Funkcja ta nie daje ci samej statystyki t, stopni swobody ani dowolnej liczby innych elementów, które chciałbyś zobaczyć, gdybyś wykonywał test statystyczny. Pakiety statystyczne poprawnie wykluczą przypadki z jednym z brakujących pomiarów i dostarczą wszystkich statystyk pomocniczych potrzebnych do zinterpretowania danych wyjściowych. Crosstabulacja i test niezależności Chi-Squared Naszym ostatecznym zadaniem jest zliczenie dwóch wyników w każdej grupie leczenia i użycie testu niezależności chi-kwadrat w celu sprawdzenia związku między leczeniem a wynikiem. Aby policzyć wyniki grupy leczenia, należy użyć tabel przestawnych. W opcji Układ kreatorów tabeli przestawnej przeciągnij Traktowanie do wiersza, Wynik do kolumny, a także do danych. Obszar danych powinien powiedzieć quotount Outcomequot ndash, jeśli nie, kliknij go dwukrotnie i wybierz quotCountquot. Jeśli chcesz procenty, kliknij dwukrotnie quotount Wyciągu, a następnie kliknij Opcje w polu Wyświetlanie danych ASrdquo, które się pojawi, wybierz quot of rowquot. Jeśli chcesz zarówno zliczeń, jak i procentów, możesz dwukrotnie przeciągnąć tę samą zmienną do obszaru danych i użyć jej raz dla zliczeń i raz dla procentów. Jednak uzyskanie testu chi-kwadrat nie jest takie proste. Jest dostępny tylko jako funkcja, a dane wejściowe potrzebne do funkcji to liczba obserwowanych w każdej kombinacji leczenia i wyniku (które masz w tabeli przestawnej) oraz oczekiwana liczba w każdej kombinacji. Oczekiwane liczby Co to jest Jak je uzyskać Jeśli masz wystarczające dane statystyczne, aby wiedzieć, jak obliczyć spodziewane liczby, i można wykonywać obliczenia w programie Excel przy użyciu względnych i bezwzględnych adresów komórkowych, powinieneś być w stanie poruszać się po tym. Jeśli nie, masz pecha. Zakładając, że udało ci się przezwyciężyć problem oczekiwanych zliczeń, możesz użyć funkcji Chitest, aby uzyskać prawdopodobieństwo zaobserwowania wartości chi-kwadrat większej niż ta dla tej tabeli. Ponownie, ponieważ używamy funkcji, nie dostajemy wielu innych niezbędnych elementów obliczeń, w szczególności wartości statystyki chi-kwadrat lub jej stopni swobody. Żaden pakiet statystyczny nie wymagałby podania oczekiwanych wartości przed obliczeniem testu chi-kwadrat niestosowania. Ponadto, wyniki zawsze będą zawierać statystykę chi-kwadrat i jej stopnie swobody, a także jej prawdopodobieństwo. Często dostaniesz również dodatkowe statystyki. Analizy dodatkowe Pozostałe analizy nie zostały wykonane na tym zbiorze danych, ale niektóre komentarze na ich temat zostały uwzględnione w celu ich kompletności. Proste częstotliwości Za pomocą tabel przestawnych można uzyskać proste częstotliwości. (Aby uzyskać więcej informacji o tym, jak uzyskać tabele przestawne, zobacz Rozkład tabeli.) Przy użyciu tabel przestawnych każda kolumna jest traktowana jako oddzielna zmienna, a etykiety na wierszu 1 będą wyświetlane na wydruku. Możesz wykonać tylko jedną zmienną naraz. Inną możliwością jest użycie funkcji Częstotliwości. Główną zaletą tej metody jest to, że po zdefiniowaniu funkcji częstotliwości dla jednej kolumny można użyć CopyPaste, aby uzyskać ją dla innych kolumn. Najpierw musisz wprowadzić kolumnę z wartościami, które chcesz policzyć (pojemnikami). Jeśli zamierzasz wykonywać częstotliwości dla wielu kolumn, pamiętaj, aby wprowadzić wartości dla kolumny z największą liczbą kategorii. na przykład jeśli 3 kolumny mają wartości 1 lub 2, a czwarta ma wartości 1,2,3,4, należy wpisać wartości bin jako 1,2,3,4. Teraz wybierz tyle pustych komórek w jednej kolumnie, aby zapisać wyniki - 4 w tym przykładzie, nawet jeśli bieżąca kolumna ma tylko 2 wartości. Następnie wybierz InsertFunctionStatisticalFrequencies w menu. Wypełnij zakres wejściowy pierwszej kolumny, którą chcesz zliczyć, używając względnych adresów (np. A1: A100). Wypełnij Zakres zasobu za pomocą bezwzględnych adresów miejsc, w których wprowadziłeś wartości do zliczenia (np. M1: M4). Kliknij Zakończ. Zwróć uwagę na pole nad nagłówkami kolumn w arkuszu, w którym wyświetlana jest formuła. Zaczyna się od wartości CZĘSTOTLIWOŚCI (quot. Umieść kursor po lewej stronie znaku we wzorze i naciśnij Ctrl-Shift-Enter Liczba zliczeń pojawi się teraz w zaznaczonych komórkach. Aby uzyskać wartości częstotliwości innych kolumn, wybierz komórki z częstotliwościami w nich i wybierz EditCopy z menu. Jeśli następna kolumna, którą chcesz zliczyć, to jedna kolumna na prawo od poprzedniej, wybierz komórkę po prawej stronie pierwszej komórki częstotliwości i wybierz EditPaste ( ctrl-V). Kontynuuj przesuwanie w prawo i wklejanie dla każdej kolumny, którą chcesz policzyć. Za każdym razem, gdy przenosisz jedną kolumnę na prawo od pierwotnych komórek częstotliwości, kolumna, która ma być zliczana, przesuwa się w prawo od pierwszej zliczonej kolumny. Jeśli chcesz również procentów, yoursquoll musi użyć funkcji Sum, aby obliczyć sumę częstotliwości, i zdefiniować wzór, aby uzyskać procent dla jednej komórki. Wybierz komórkę do przechowywania pierwszego procentu i wpisz formułę do formuły pole u góry arkusza - np. N1100N 5 - gdzie N1 jest komórką z częstotliwością dla pierwszej kategorii, a N5 jest komórką z sumą częstotliwości. Użyj CopyPaste, aby uzyskać formułę dla pozostałych komórek pierwszej kolumny. Gdy masz procenty dla jednej kolumny, możesz skopiować je do innych kolumn. Yoursquoll musi być ostrożny przy używaniu adresów względnych i bezwzględnych W powyższym przykładzie użyliśmy N5 dla mianownika, więc gdy skopiujemy formułę do następnej częstotliwości w tej samej kolumnie, to nadal będzie szukać sumy w rzędzie 5 ale gdy skopiujemy formułę do innej kolumny, przejdzie ona do częstotliwości w następnej kolumnie. Na koniec możesz użyć Histogramu w menu Analiza danych. Możesz wykonać tylko jedną zmienną naraz. Podobnie jak w przypadku funkcji Frequencies, należy wprowadzić kolumnę z granicami quotbinquot. Aby policzyć liczbę wystąpień 1 i 2, należy wprowadzić 0,1,2 w trzech sąsiadujących komórkach i podać zakres tych trzech komórek jako przedziały w oknie dialogowym. Dane wyjściowe nie są oznaczone żadnymi etykietami, które możesz mieć w wierszu 1, ani nawet literą kolumny. Jeśli wykonujesz częstotliwości na wielu zmiennych, będziesz miał trudności z ustaleniem, która częstotliwość należy do której kolumny danych. Regresja liniowa Ponieważ regresja jest jedną z częściej używanych analiz statystycznych, wypróbowaliśmy ją, mimo że nie wykonaliśmy analizy regresji dla tego przykładu. Procedura Regresja w narzędziach analizy danych pozwala wybrać jedną kolumnę jako zmienną zależną i zestaw kolumn sąsiadujących z niezależnymi. Jednak nie toleruje żadnych pustych komórek w dowolnym miejscu zakresów wejściowych, a użytkownik jest ograniczony do 16 zmiennych niezależnych. Dlatego jeśli masz puste komórki, musisz skopiować wszystkie kolumny biorące udział w regresji do nowych kolumn i usunąć wszystkie wiersze zawierające puste komórki. Duże modele z więcej niż 16 predykcjami nie mogą być w ogóle wykonane. Analiza wariancji Zasadniczo, cechy ANOVA Excels są ograniczone do kilku specjalnych przypadków rzadko spotykanych poza podręcznikami i wymagają wielu zmian w danych. Jednokierunkowe ANOVA Dane muszą być ułożone w oddzielnych i sąsiednich kolumnach (lub rzędach) dla każdej grupy. Oczywiście nie sprzyja to jednokierunkowości w więcej niż jednej grupie. Jeśli masz etykiety w wierszu 1, dane wyjściowe będą korzystać z etykiet. ANOVA z dwoma czynnikami bez replikacji Ma to miejsce tylko w przypadku jednej obserwacji na komórkę (to znaczy nie występuje błąd związany z komórką wewnętrzną). Zakres wejściowy to prostokątne ułożenie komórek, z rzędami reprezentującymi poziomy jednego czynnika, kolumnami poziomów innego czynnika, a zawartość komórki - jedną wartością w tej komórce. ANOVA z dwoma czynnikami z replikacjami Powoduje to dwukierunkową ANOVA o równych rozmiarach komórek. Wejście musi być prostokątnym obszarem z kolumnami reprezentującymi poziomy jednego czynnika, a wiersze reprezentujące kopie w obrębie poziomów innego czynnika. Zakres wejściowy MUSI również zawierać dodatkowy wiersz u góry i kolumnę po lewej stronie, z etykietami wskazującymi czynniki. Jednak te etykiety nie są używane do oznaczania wynikowej tabeli ANOVA. Kliknij Pomoc w oknie dialogowym ANOVA, aby zobaczyć obraz zakresu wejściowego. Żądanie wielu analiz Jeśli miałeś wiele różnych procedur statystycznych, które chciałbyś wykonać na swoich danych, prawie na pewno będziesz musiał dużo sortować, zmieniać układ, kopiować i wklejać swoje dane. Dzieje się tak, ponieważ każda procedura wymaga, aby dane były ułożone w określony sposób, często różniący się od sposobu, w jaki inna procedura chce uporządkować dane. W naszym małym teście musieliśmy posortować wiersze, aby wykonać test t, i skopiować niektóre komórki, aby uzyskać etykiety dla danych wyjściowych. Musieliśmy wyczyścić zawartość niektórych komórek w celu uzyskania prawidłowego sparowanego t-testu, ale nie chcieliśmy, aby te komórki zostały wyczyszczone dla innego testu. A my robiliśmy tylko pięć zadań. Nie robi się lepiej, gdy próbujesz zrobić więcej. Nie ma pojedynczego układu danych, który pozwoliłby na wykonanie wielu różnych analiz bez wykonywania wielu różnych kopii danych. Potrzeba manipulowania danymi na wiele sposobów znacznie zwiększa szansę na wprowadzenie błędów. Używając programu statystycznego, dane byłyby zwykle ułożone z wierszami reprezentującymi podmioty, a kolumny reprezentujące zmienne (tak jak w naszych przykładowych danych). Dzięki tej aranżacji możesz wykonywać dowolne analizy omówione tutaj, a także wiele innych, bez konieczności sortowania lub zmiany swoich danych w jakikolwiek sposób. Tylko znacznie bardziej złożone analizy, poza możliwościami Excela i zakresem tego artykułu, wymagałyby przegrupowania danych. Praca z wieloma kolumnami Co by było, gdyby dane nie zawierały 4, ale 40 kolumn, z mieszanką miar jakościowych i ciągłych? Jak łatwo można skalować powyższe procedury do większego problemu. W najlepszym przypadku niektóre procedury statystyczne mogą akceptować wiele sąsiednich kolumn dla danych wejściowych i interpretować każdą kolumnę jako inną miarę. Procedury opisów i korelacji są tego rodzaju, więc możesz zażądać statystyk opisowych lub korelacji dla dużej liczby zmiennych ciągłych, o ile są one wprowadzane w sąsiednich kolumnach. Jeśli nie sąsiadują ze sobą, musisz zmienić kolejność kolumn lub użyć polecenia "kopiuj i wklej", aby byłysiadować. Wiele procedur można jednak zastosować tylko do jednej kolumny na raz. Testy T (niezależne lub sparowane), proste częstotliwości, test niezależności chi-kwadrat i wiele innych procedur są w tej klasie. Stanowiłoby to poważną wadę, gdybyś miał więcej niż garść kolumn, nawet jeśli używasz wycinania i wklejania lub makr w celu zmniejszenia pracy. Oprócz wielokrotnego powtarzania żądania, musisz zdecydować, gdzie przechowywać wyniki każdego z nich, i upewnić się, że jest odpowiednio oznakowany, abyś mógł łatwo zlokalizować i zidentyfikować każde wyjście. Na koniec program Excel nie udostępnia dziennika ani innego rekordu do śledzenia wykonanych czynności. Może to być poważną wadą, jeśli chcesz móc powtórzyć tę samą (lub podobną) analizę w przyszłości lub nawet po prostu zapomnieć o tym, co już zrobiłeś. Korzystając z pakietu statystycznego, możesz poprosić o test na tyle zmiennych, ile potrzebujesz na raz. Każda z nich będzie odpowiednio oznaczona i ułożona na wydruku, więc nie ma wątpliwości co do tego, co. Możesz także uzyskać dziennik, a często także zestaw poleceń, które można wykorzystać do udokumentowania pracy lub do powtórzenia analizy bez konieczności ponownego wykonywania wszystkich czynności. Chociaż Excel jest cienkim arkuszem kalkulacyjnym, nie jest to pakiet analizy danych statystycznych. Przy całej uczciwości nigdy nie miało to być jedno. Należy pamiętać, że Data Analysis ToolPak to quotadd-inquot - dodatkowa funkcja, która umożliwia wykonanie kilku szybkich obliczeń. Nie powinno więc dziwić, że właśnie to jest dobre - kilka szybkich obliczeń. Jeśli spróbujesz użyć go do bardziej szczegółowych analiz, napotkasz trudności wynikające z jednego lub wszystkich z następujących ograniczeń: Potencjalne problemy z analizami z brakującymi danymi. Mogą być podstępne, ponieważ nieostrożny użytkownik prawdopodobnie nie zda sobie sprawy, że coś jest nie tak. Brak elastyczności w analizach, które można wykonać ze względu na oczekiwania dotyczące uporządkowania danych. Powoduje to konieczność przycinania i przerabiania arkusza danych na różne sposoby, zwiększając prawdopodobieństwo wystąpienia błędów. Dane wyjściowe są rozproszone w wielu różnych arkuszach roboczych lub całym arkuszu kalkulacyjnym, w którym należy wziąć odpowiedzialność za porządkowanie w rozsądny sposób. Dane wyjściowe mogą być niekompletne lub mogą nie być odpowiednio oznakowane, co zwiększa prawdopodobieństwo błędnego zidentyfiko - wania danych wyjściowych. Musisz wielokrotnie powtarzać żądania dotyczące niektórych analiz, aby uruchomić je dla wielu zmiennych lub zażądać wielu opcji. Trzeba zrobić kilka rzeczy, definiując własne funkcje, z towarzyszącym ryzykiem błędów. Brak informacji o tym, co zrobiłeś, aby wygenerować wyniki, utrudniając udokumentowanie analizy lub powtórzenie jej w późniejszym czasie, jeśli to konieczne. Jeśli masz więcej niż około 10 lub 12 kolumn i chcesz zrobić coś poza statystykami opisowymi i prawdopodobnie korelacjami, powinieneś używać pakietu statystycznego. Jest kilka odpowiednich dostępnych przez licencję na stronie przez OIT, lub możesz ich używać w dowolnym laboratorium komputerowym OIT. Jeśli posiadasz program Excel na swoim komputerze i nie chcesz płacić za program statystyczny, koniecznie użyj Excela do wprowadzenia danych (z wierszami przedstawiającymi tematy i kolumny dla zmiennych). Wszystkie wymienione pakiety statystyczne mogą odczytywać pliki Excel, więc możesz zrobić (czasochłonnym) wprowadzanie danych w domu i udać się do laboratorium, aby wykonać analizę. Znacznie szersza dyskusja na temat pułapek korzystania z programu Excel, z wieloma dodatkowymi linkami, jest dostępna w burns-stat Kliknij na samouczki, a następnie na dodatek do arkusza kalkulacyjnego. Aby uzyskać pomoc lub więcej informacji o oprogramowaniu statystycznym, skontaktuj się z biurem konsultingowym Biostatistics. Telefon 545-2949Jak obliczyć średnie kroczące w Excel Excel Analiza danych dla manekinów, 2. wydanie Komenda Analiza danych zapewnia narzędzie do obliczania ruchomych i wykładanych wykładniczo średnich w Excelu. Załóżmy, na potrzeby ilustracji, że zebrałeś dzienne informacje o temperaturze. Chcesz obliczyć trzydniową średnią ruchomą 8212 średnią z ostatnich trzech dni 8212 w ramach prostego prognozowania pogody. Aby obliczyć średnie kroczące dla tego zestawu danych, wykonaj następujące kroki. Aby obliczyć średnią ruchomą, najpierw kliknij przycisk polecenia Data tab8217s Analiza danych. Gdy program Excel wyświetli okno dialogowe Analiza danych, wybierz pozycję Średnia ruchoma z listy, a następnie kliknij przycisk OK. Excel wyświetla okno dialogowe Średnia ruchoma. Wskaż dane, których chcesz użyć do obliczenia średniej ruchomej. Kliknij pole tekstowe Zakres wprowadzania w oknie dialogowym Średnia ruchoma. Następnie określ zakres wejściowy, wpisując adres zakresu arkusza lub za pomocą myszy, aby wybrać zakres arkusza roboczego. Odwołanie do zakresu powinno wykorzystywać bezwzględne adresy komórek. Bezwzględny adres komórki poprzedza literę kolumny i numer wiersza ze znakami, tak jak w A1: A10. Jeśli pierwsza komórka w zakresie wejściowym zawiera etykietę tekstową do identyfikacji lub opisu danych, zaznacz pole wyboru Etykiety w pierwszym wierszu. W polu tekstowym Odstęp, powiedz Excelowi, ile wartości ma zawierać obliczenie średniej ruchomej. Możesz obliczyć średnią ruchomą za pomocą dowolnej liczby wartości. Domyślnie program Excel używa ostatnich trzech wartości do obliczenia średniej ruchomej. Aby określić, że do obliczenia średniej ruchomej należy użyć innej liczby wartości, wprowadź tę wartość w polu tekstowym Odstęp czasu. Powiedz programowi Excel, gdzie umieścić dane średniej ruchomej. Użyj pola tekstowego Zakres wyników, aby określić zakres arkusza roboczego, w którym chcesz umieścić dane średniej ruchomej. W przykładzie z arkusza roboczego dane średniej ruchomej zostały umieszczone w zakresie arkusza roboczego B2: B10. (Opcjonalnie) Określ, czy chcesz wykres. Jeśli chcesz wykres przedstawiający średnią ruchomą, zaznacz pole wyboru Wynik wykresu. (Opcjonalnie) Wskaż, czy chcesz obliczać standardowe informacje o błędach. Jeśli chcesz obliczyć błędy standardowe dla danych, zaznacz pole wyboru Błędy standardowe. Program Excel umieszcza standardowe wartości błędów obok wartości średniej ruchomej. (Standardowa informacja o błędzie przechodzi do C2: C10.) Po zakończeniu określania, jakie średnie ruchome informacje mają zostać obliczone i gdzie chcesz je umieścić, kliknij OK. Program Excel oblicza średnią ruchomą. Uwaga: Jeśli program Excel nie ma wystarczająco dużo informacji do obliczenia średniej ruchomej dla błędu standardowego, umieszcza komunikat o błędzie w komórce. Możesz zobaczyć kilka komórek, które pokazują ten komunikat o błędzie jako wartość.

No comments:

Post a Comment