Stata เคลื่อนไหว เฉลี่ย Egen


โครงสรางขอมูลนี้ไมเหมาะที่จะใชเปนอยางมากสมมติวารหัสตัวผานที่คุณตองการกอนรูปแบบ e g หลังจากนั้นคาเฉลี่ยเคลื่อนที่จะใชงานอยางงาย tssmooth หรือเพียงแค่สรางขอมูลเพิ่มเติมเกี่ยวกับเหตุผลที่โครงสรางขอมูลของคุณ จำเป็นต้องห่วงไม่จำเป็นต้องเกี่ยวข้องกับ egen แต่คุณจะสร้างตัวแปรเสริมใหม่หลายใช้ในการวิเคราะห์ภายหลังใด ๆ จะอยู่ที่ไหนสักแห่งระหว่างอึดอัดและ impossible. EDIT ฉันจะให้ห่วงตัวอย่างในขณะที่ไม่ได้ย้ายจากท่าทางของฉันว่ามันเป็นเทคนิคที่ไม่ดี ฉันไม่เห็นเหตุผลที่อยู่เบื้องหลังการตั้งชื่อของคุณโดยที่ P1947 เป็นค่าเฉลี่ยสำหรับ 1943-1945 ผมคิดว่าเป็นเพียงข้อผิดพลาด Let s สมมุติว่าเรามีข้อมูลสำหรับ 1913-2012 สำหรับหมายถึง 3 ปีเราสูญเสียหนึ่งปีที่ปลายแต่ละด้าน . ที่สามารถเขียนกระชับมากขึ้นค่าใช้จ่ายของวุ่นวายของแมโครภายในแมโครใช้น้ำหนักไม่เท่ากันเป็นเรื่องง่ายตามข้างต้นเหตุผลเดียวที่จะใช้ egen คือว่ามัน doesn t ให้ขึ้นถ้ามี missings ซึ่งข้างต้นจะทำ. เป็นเรื่องของการเสร็จสิ้น ess ทราบว่าง่ายต่อการจัดการ missings โดยไม่ต้องใช้ตัวบ่งชี้และตัวหารหากค่าทั้งหมดหายไปจะลดลงเหลือ 0 0 หรือหายไปมิฉะนั้นหากค่าใดหายไปเราจะเพิ่ม 0 ลงในเศษและ 0 ถึง ตัวหารซึ่งเป็นเช่นเดียวกับละเลยมันธรรมชาติรหัสเป็นที่ยอมรับได้ข้างต้นสำหรับค่าเฉลี่ยของ 3 ปี แต่อย่างใดอย่างหนึ่งสำหรับกรณีที่หรือค่าเฉลี่ยกว่าปีมากขึ้นเราจะแทนที่เส้นข้างต้นโดยวงซึ่งเป็นสิ่งที่ egen ไม่ การวิเคราะห์ข้อมูลข้อมูลและสถิติ Software. Nicholas J Cox, Durham University, UK Christopher Baum, Boston College. egen, ma และข้อ จำกัด ของมันคำสั่งที่ชัดเจนที่สุดของ Stata สำหรับการคำนวณค่าเฉลี่ยเคลื่อนที่เป็นฟังก์ชัน ma ของ egen ให้การแสดงออกจะสร้าง a - ค่าเฉลี่ยเคลื่อนที่ของค่าเฉลี่ยของนิพจน์ดังกล่าวโดยค่าเริ่มต้นจะถูกนำมาเป็น 3 แต่ต้องเป็นเลขคี่อย่างไรก็ตามตามที่ระบุด้วยตัวเอง egen ma อาจไม่สามารถรวมเข้ากับ varlist ได้และเนื่องจากเหตุผลดังกล่าวจะไม่สามารถใช้ได้กับแผงควบคุม ข้อมูลในกรณีใด ๆ มันยืนอยู่นอกชุดของ คำสั่งที่เขียนโดยเฉพาะสำหรับชุดข้อมูลเวลาดูซีรีส์เวลาสำหรับรายละเอียดแนวทางการเลือกวิธีคำนวณค่าเฉลี่ยเคลื่อนที่สำหรับข้อมูลแผงมีอย่างน้อยสองตัวเลือกทั้งสองขึ้นอยู่กับชุดข้อมูลที่ได้รับการตั้งค่าก่อนหน้านี้เป็นอย่างมากที่คุ้มค่าการทำไม่เพียง แต่คุณสามารถช่วยตัวเอง ซ้ำตัวแปรระบุตัวแปรและตัวแปรเวลา แต่ Stata ทำงานอย่างชาญฉลาดให้ช่องว่างใด ๆ ในข้อมูล 1 เขียนคำนิยามของคุณเองโดยใช้ generate. Using ตัวดำเนินการแบบอนุกรมเช่น L และ F ให้คำจำกัดความของค่าเฉลี่ยเคลื่อนที่เป็นอาร์กิวเมนต์ที่สร้างขึ้น ถ้าคุณทำเช่นนี้คุณจะเป็นธรรมชาติไม่ จำกัด เพียงค่าเฉลี่ยถ่วงน้ำหนักที่ถ่วงน้ำหนักไม่ถ่วงน้ำหนักที่ศูนย์กลางซึ่งคำนวณโดยตัวอย่างเช่นตัวอย่างเช่นค่าเฉลี่ยเคลื่อนที่สามช่วงที่ถ่วงน้ำหนักอย่างเท่าเทียมกันจะได้รับโดยน้ำหนักและสามารถระบุน้ำหนักได้โดยง่าย . คุณสามารถของหลักสูตรระบุการแสดงออกเช่น myvar เข้าสู่ระบบแทนชื่อตัวแปรเช่น myvar. One ประโยชน์ใหญ่ของวิธีนี้คือ Stata จะไม่ถูกต้อง t hing สำหรับข้อมูลชั้นนำแผงและค่าปกคลุมด้วยวัตถุแข็งจะทำงานออกภายในแผงเช่นเดียวกับเหตุผลตรรกะที่พวกเขาควรจะเป็นข้อเสียที่โดดเด่นที่สุดคือบรรทัดคำสั่งจะได้รับค่อนข้างยาวถ้าค่าเฉลี่ยเคลื่อนที่เกี่ยวข้องกับเงื่อนไขหลายอื่น ๆ อีกตัวอย่างหนึ่งคือการย้ายด้านเดียว ค่าเฉลี่ยขึ้นอยู่กับค่าก่อนหน้านี้สิ่งนี้อาจเป็นประโยชน์ในการสร้างความคาดหวังในการปรับตัวของตัวแปรที่จะอิงกับข้อมูลที่จะคาดการณ์ได้อย่างชัดเจนสำหรับช่วงเวลาปัจจุบันตามค่าสี่ค่าที่ผ่านมาโดยใช้รูปแบบการถ่วงน้ำหนักแบบคงที่ A 4- ความล่าช้าระยะเวลาอาจจะใช้กันอย่างแพร่หลายโดยใช้ timeseries รายไตรมาส 2 ใช้ตัวกรอง egen จาก SSC ใช้ตัวกรอง egen function ที่ผู้ใช้เขียนไว้จากแพคเกจ egenmore ใน SSC ใน Stata 7 ที่อัปเดตหลังจาก 14 พฤศจิกายน 2544 คุณสามารถติดตั้งแพคเกจนี้ได้ภายใน ซึ่งช่วยให้ egenmore ชี้ไปที่รายละเอียดของตัวกรองตัวอย่างสองตัวอย่างข้างต้นจะแสดงผล ในการเปรียบเทียบนี้วิธีการสร้างอาจจะโปร่งใสมากขึ้น แต่เราจะเห็นตัวอย่างของสิ่งที่ตรงกันข้ามในขณะที่ความล่าช้าเป็นจำนวนที่นำไปสู่การลดจำนวนที่เป็นลบในกรณีนี้ -1 -1 จะขยายเป็น -1 0 1 หรือนำ 1, ล้าหลัง 0 , lag 1 Coef ficients, numlists อื่นคูณ lagging ที่สอดคล้องกันหรือรายการชั้นนำในกรณีนี้รายการเหล่านี้เป็น myvar และผลของตัวเลือกปกติคือการปรับค่าสัมประสิทธิ์แต่ละตัวด้วยผลคูณของค่าสัมประสิทธิ์เพื่อให้ coef 1 1 1 normalize คือ ค่าสัมประสิทธิ์ของ 1 3 1 3 1 3 และ coef 1 2 1 normalize เท่ากับค่าสัมประสิทธิ์ของ 1 4 1 2 1 4 คุณต้องระบุไม่เพียง แต่ความล่าช้า แต่ยังเป็นค่าสัมประสิทธิ์เนื่องจาก egen, ma ให้กรณีถ่วงน้ำหนักอย่างเท่าเทียมกัน เหตุผลหลักสำหรับตัวกรอง egen คือการสนับสนุนกรณีถ่วงน้ำหนักที่ไม่เท่ากันซึ่งคุณต้องระบุค่าสัมประสิทธิ์นอกจากนี้ยังอาจกล่าวได้ว่าการบังคับให้ผู้ใช้ระบุค่าสัมประสิทธิ์เป็นแรงกดดันเล็กน้อยต่อพวกเขาในการคิดถึงค่าสัมประสิทธิ์ที่ต้องการ สำหรับน้ำหนักที่เท่ากันคือเราคาดเดาความเรียบง่าย แต่น้ำหนักที่เท่ากันมีคุณสมบัติโดเมนความถี่หมัดกล่าวคือการพิจารณาเพียงตัวเดียวตัวอย่างที่สามข้างต้นอาจเป็นได้ทั้งสองแบบซึ่งมีความซับซ้อนเพียงเล็กน้อยในขณะที่วิธีการสร้างมีกรณีที่ egen , ตัวกรองให้สูตรที่ง่ายกว่าการสร้างถ้าคุณต้องการตัวกรองแบบทวินามระยะ 9 ตัวซึ่งนักภูมิอากาศวิทยาหาประโยชน์แล้วบางทีอาจดูน่ากลัวน้อยกว่าและง่ายกว่าที่จะทำได้ดีกว่าเช่นเดียวกับวิธีการสร้าง egen ตัวกรองทำงานได้อย่างถูกต้อง กับข้อมูลแผงในความเป็นจริงตามที่ระบุไว้ข้างต้นจะขึ้นอยู่กับชุดข้อมูลที่ได้รับก่อน tsset ปลายกราฟิกหลังจากคำนวณค่าเฉลี่ยเคลื่อนที่ของคุณคุณอาจจะต้องการดูกราฟคำสั่งที่ผู้ใช้เขียน tsgraph เป็นสมาร์ทเกี่ยวกับชุดข้อมูล tsset ติดตั้งใน Stata 7 ที่ทันสมัยโดย ssc inst tsgraph เกี่ยวกับ subsetting กับถ้าไม่มีตัวอย่างข้างต้นใช้ประโยชน์จากข้อ จำกัด หากใน egen, ma จะไม่อนุญาตหากมีการระบุบางครั้งคน wa nt ที่จะใช้ถ้าเมื่อคำนวณค่าเฉลี่ยเคลื่อนที่ แต่การใช้งานของมันซับซ้อนกว่าเล็กน้อยโดยปกติแล้วสิ่งที่คุณคาดหวังจากค่าเฉลี่ยเคลื่อนที่ที่คำนวณได้ถ้าหากให้เราระบุสองความเป็นไปได้การตีความแนวนอนผมไม่อยากเห็นผลใด ๆ ข้อสังเกตที่ยกเว้นการตีความของทรานแซกชันฉันไม่ต้องการให้คุณใช้ค่าสำหรับการสังเกตที่ไม่ได้ต่อไปนี้เป็นตัวอย่างที่เป็นรูปธรรมสมมติว่าเป็นผลมาจากเงื่อนไขบางอย่างถ้าข้อสังเกต 1-42 รวมอยู่ด้วย แต่ไม่ใช่ข้อสังเกต 43 แต่ค่าเฉลี่ยเคลื่อนที่ สำหรับ 42 จะขึ้นอยู่กับสิ่งอื่นใดเกี่ยวกับค่าสำหรับการสังเกต 43 ถ้าค่าเฉลี่ยถอยหลังไปข้างหน้าและมีความยาวอย่างน้อย 3 และมันก็จะขึ้นอยู่กับบางส่วนของข้อสังเกตดังกล่าว 44 เป็นต้นไปในบางสถานการณ์การคาดเดาของเราคือว่า คนส่วนใหญ่จะไปตีความอ่อนแอ แต่ไม่ว่าจะถูกต้อง egen ตัวกรองไม่สนับสนุนถ้าอย่างใดอย่างหนึ่งคุณสามารถละเลยสิ่งที่คุณ don t ต้องการหรือแม้กระทั่งการตั้งค่าที่ไม่พึงประสงค์เพื่อหายไปภายหลังข y ใช้ replace. A ทราบเกี่ยวกับผลลัพธ์ที่หายไปที่ส่วนท้ายของชุดเนื่องจากค่าเฉลี่ยเคลื่อนที่เป็นหน้าที่ของความล่าช้าและโอกาสในการขาย egen, ma ผลิตขาดหายไปที่ความล่าช้าและโอกาสในการขายไม่มีอยู่ที่จุดเริ่มต้นและจุดสิ้นสุดของชุดตัวเลือก nomiss บังคับให้คำนวณค่าเฉลี่ยเคลื่อนที่ที่สั้นลงสำหรับหางในทางตรงกันข้ามไม่สร้างหรือ egen กรองไม่หรือช่วยอะไรพิเศษเพื่อหลีกเลี่ยงผลลัพธ์ที่หายไปหากค่าใด ๆ ที่จำเป็นสำหรับการคำนวณหายไปผลลัพธ์ที่ได้จะหายไป ขึ้นอยู่กับผู้ใช้ในการตัดสินใจว่าจะมีการผ่าตัดแก้ไขและจำเป็นต้องใช้สำหรับการสังเกตการณ์ดังกล่าวสันนิษฐานว่าหลังจากดูที่ชุดข้อมูลและพิจารณาจากวิทยาศาสตร์ต้นแบบใด ๆ ที่สามารถนำมาสู่ความหมั่นถอยหลัง Lowess. We จะทำงานร่วมกับข้อมูลจากการสำรวจครัวเรือน WFS ของโคลอมเบีย, ดำเนินการใน 1975-1976 ฉัน tabulated การกระจายอายุของสมาชิกในครัวเรือนทั้งหมดและบันทึกไว้ในไฟล์ ascci ซึ่งตอนนี้เราอ่านและพล็อตที่คุณสามารถดูการกระจายมีลักษณะเรียบน้อยกว่า ข้อมูลจากฟิลิปปินส์ที่เราได้ศึกษาก่อนหน้านี้คุณสามารถคำนวณดัชนี Myers สำหรับการแจกจ่ายนี้ได้หรือไม่วิธีการที่ง่ายที่สุดคือการใช้ค่าเฉลี่ยเคลื่อนที่ที่เรียกว่าค่าเฉลี่ยที่ใช้โดยทั่วไปวิธีการที่ใช้กันทั่วไปคือการใช้ หน้าต่างของการสังเกต 2k 1 k ด้านซ้ายและ k ด้านขวาของแต่ละข้อสังเกตค่าของ k คือการค้าระหว่างความเรียบเนียนของความเหมาะสมการดูแลเป็นพิเศษต้องอยู่ในช่วงสุดขั้วของช่วง Stata สามารถคำนวณหาค่าเฉลี่ยของการวิ่งผ่าน Lowess มีทางเลือกหมายถึงและเป็นปัญหาที่เกิดขึ้นบ่อยๆปัญหาที่พบบ่อยคือการใช้น้ำหนักที่ให้ความสำคัญกับเพื่อนบ้านที่ใกล้เคียงที่สุดและน้อยกว่าผู้ที่อยู่ห่างออกไปฟังก์ชั่นน้ำหนักที่เป็นที่นิยมคือ Tukey s tri-cube กำหนดให้เป็น wd 1 - d 3 3 สำหรับ d 1 และ 0 เป็นอย่างอื่นโดยที่ d คือระยะทางถึงจุดเป้าหมายที่แสดงเป็นเศษส่วนของแบนด์วิดท์ Stata สามารถคำนวณนี้โดยใช้ lowess กับตัวเลือกที่มีค่าถ้าคุณไม่คิดว่าจะมีการพัฒนาใหม่อีกวิธีหนึ่งก็คือการใช้ R unning lines เรากำหนดพื้นที่ใกล้เคียงสำหรับแต่ละจุดโดยทั่วไป k เพื่อนบ้านที่ใกล้ที่สุดในแต่ละด้านให้พอดีกับเส้นการถดถอยไปยังจุดในพื้นที่ใกล้เคียงและใช้เพื่อคาดการณ์ค่าความนุ่มนวลสำหรับการสังเกตดัชนีนี้ดูเหมือนจะมาก ทำงานได้ แต่การคำนวณสามารถทำได้อย่างมีประสิทธิภาพโดยใช้สูตรการปรับปรุงการถดถอย Stata สามารถคำนวณหาเส้นทำงานผ่าน Lowess ได้หากคุณละเว้น แต่รวมไว้ightดีขึ้นยังคงใช้เส้นน้ำหนักที่ให้น้ำหนักมากขึ้นในการสังเกตที่ใกล้เคียงที่สุดซึ่งเป็นสิ่งที่ Lowess นุ่มนวล นี่เป็นวิธีที่ดีที่สุดในครอบครัวของ Stata lowess ใช้เส้นถ่วงน้ำหนักถ้าคุณละเว้นและ meanight. R ดำเนิน lowess เรียบโดยผ่าน lowess ฟังก์ชันและ lesser รุ่นใหม่ซึ่งใช้อินเทอร์เฟซสูตรกับตัวทำนายหนึ่งตัวหรือมากกว่าและค่าดีฟอลต์ที่ไม่เหมือนกันบางส่วนองศาพารามิเตอร์จะควบคุมระดับของโพรเซสพอยน์ olynomial ค่าดีฟอลต์คือ 2 สำหรับสมการกำลังสองทางเลือกคือ 1 สำหรับเส้นและ 0 สำหรับการรันหมายถึงการใช้งานทั้งสองแบบสามารถใช้ estimator ที่มีประสิทธิภาพโดยมีจำนวน iterations ที่ควบคุมโดย iter iterations หรือ iterations ประเภท less และ lowess ในคอนโซล R สำหรับข้อมูลเพิ่มเติม ggplot คุณสามารถซ้อนทับ lowess เรียบโดยการเรียก geomsmooth รูปด้านล่างแสดงข้อมูลโคลัมเบียและ lowess เรียบกับช่วงหรือแบนด์วิดธ์เท่ากับ 25 ของข้อมูลคุณอาจต้องการลอง badwidths ที่แตกต่างกันเพื่อดูว่าผลลัพธ์แตกต่างกันอย่างไร Revisited การปรับการกระจายอายุให้เป็นวิธีที่ดีกว่าในการประเมินการตั้งค่าหลักมากกว่าการผสม Myers ลองคำนวณเลขท้ายสุดท้ายของอายุและจัดลำดับข้อมูลในช่วงข้อมูลทั้งหมดโดยใช้ความถี่ที่สังเกตได้และความถี่ต่ำจะแสดงให้เห็นชัดขึ้น การตั้งค่าสำหรับวัยที่สิ้นสุดใน 0 และ 5 ซึ่งเป็นเรื่องธรรมดามากและอาจเป็น 2 เช่นกันตอนนี้เราใช้เรียบเป็น weight. The ความถี่เรียบแสดงให้เห็นว่าเราคาดหวังน้อยกว่า pe ople ที่ตัวเลขที่สูงขึ้นแม้ในการกระจายราบรื่นกับมากขึ้นสิ้นสุดใน 0 กว่า 9 ขณะนี้เราพร้อมที่จะคำนวณดัชนีของการตั้งค่าหลักที่กำหนดไว้เป็นครึ่งหนึ่งของผลรวมของความแตกต่างแน่นอนระหว่างความถี่ที่สังเกตและราบรื่นเราเห็นว่าเราจะต้อง การปรับเปลี่ยน 5 5 ข้อสังเกตเพื่อกำจัดข้อได้เปรียบหลักคุณอาจต้องการเปรียบเทียบผลลัพธ์นี้กับดัชนี Myers 2017 Germ n Rodr guez, Princeton University

Comments

Popular posts from this blog

หุ้น ย้อนกลับ แยก ตัวเลือก ผลกระทบ

6 เดือน เฉลี่ยเคลื่อนที่

เข้าใจ องค์กร หุ้น ตัวเลือก