II. KERANGKA TEORI
2.1 Konsep Dasar Curve Fitting
Curve Fitting adalah metode matematis yang digunakan untuk menemukan persamaan atau fungsi matematis yang paling sesuai (best fit) dengan sekumpulan data eksperimen. Dalam konteks teknik, data yang diperoleh dari pengukuran sensor, eksperimen laboratorium, maupun observasi lapangan hampir selalu mengandung noise dan ketidakpastian, sehingga tidak ada satu pun fungsi yang dapat melewati semua titik data secara tepat. Curve Fitting tidak bertujuan untuk menghubungkan setiap titik data secara presisi (interpolasi), melainkan untuk menemukan fungsi y = f(x) yang merepresentasikan tren umum dari keseluruhan dataset dengan error minimum.Prinsip kerja Curve Fitting dapat dipahami melalui analogi sederhana: bayangkan Anda memiliki sekumpulan titik yang tersebar di bidang kartesian, dan Anda ingin menggambar satu garis atau kurva yang ‘paling dekat’ dengan semua titik tersebut secara keseluruhan. Garis atau kurva inilah yang disebut model matematis hasil Curve Fitting. Model ini kemudian dapat digunakan untuk tiga keperluan utama: pertama, membuat model matematis yang merepresentasikan fenomena fisik; kedua, memprediksi nilai variabel output (y) untuk nilai input (x) yang belum pernah diukur sebelumnya; dan ketiga, menganalisis hubungan dan korelasi antarvariabel untuk pemahaman yang lebih mendalam tentang sistem yang dipelajari.Dalam pemilihan jenis fungsi untuk Curve Fitting, insinyur harus mempertimbangkan karakteristik fisik dari sistem yang dimodelkan. Untuk hubungan yang bersifat proporsional dan monoton (semakin besar x, semakin besar y secara konstan), Linear Regression adalah pilihan yang tepat dan efisien. Namun, jika data menunjukkan pola kurva seperti parabola, eksponensial, atau terdapat titik maksimum/minimum, maka diperlukan Polynomial Regression atau bahkan fungsi nonlinear lainnya. Kegagalan dalam memilih jenis fungsi yang tepat akan menghasilkan model dengan akurasi rendah, meskipun proses perhitungan dilakukan dengan benar.
2.2 Least Squares Regression
Least Squares Regression adalah metode optimasi yang digunakan dalam Curve Fitting untuk menentukan parameter-parameter (koefisien) dari fungsi model sedemikian rupa sehingga total kuadrat error antara nilai data aktual (yแตข) dan nilai prediksi model (y_model) menjadi minimum. Secara matematis, fungsi yang diminimalkan adalah S = ฮฃ(yแตข – y_model)ยฒ, di mana S adalah jumlah kuadrat selisih (Sum of Squares of Errors). Penggunaan kuadrat dari selisih (bukan nilai absolutnya) memiliki keuntungan matematis yaitu fungsi S menjadi differentiable (dapat diturunkan), sehingga nilai minimum dapat dicari menggunakan kalkulus diferensial.Untuk kasus Linear Regression dengan model y = a + bx, nilai slope (b) dan intercept (a) yang optimal diperoleh dengan menurunkan fungsi S terhadap masing-masing parameter dan menyamakan turunannya dengan nol (kondisi minimum). Proses ini menghasilkan sistem dua persamaan linear yang disebut Normal Equations, dengan solusi analitik sebagai berikut: b = (nฮฃxy – ฮฃxฮฃy) / (nฮฃxยฒ – (ฮฃx)ยฒ) dan a = (ฮฃy – bฮฃx) / n, di mana n adalah jumlah data, ฮฃxy adalah jumlah hasil kali x dan y, ฮฃxยฒ adalah jumlah kuadrat x, serta ฮฃx dan ฮฃy adalah jumlah total x dan y masing-masing.Keunggulan utama metode Least Squares adalah sifat optimalnya yang dapat dibuktikan secara teoritis melalui Gauss-Markov Theorem: di antara semua estimator linear yang tidak bias (unbiased), estimator Least Squares memiliki varians terkecil. Artinya, dari semua cara yang mungkin untuk mencocokkan garis atau kurva dengan data, metode Least Squares menghasilkan estimasi parameter yang paling efisien secara statistik. Hal ini menjadikan Least Squares sebagai metode standar de facto dalam analisis regresi untuk berbagai disiplin ilmu, mulai dari fisika dan teknik hingga ekonomi dan ilmu sosial.
2.3 Linear vs Polynomial Regression
Linear Regression mengasumsikan bahwa hubungan antara variabel independen x dan variabel dependen y dapat dinyatakan sebagai fungsi garis lurus y = a + bx. Model ini memiliki dua parameter yang perlu ditentukan: a (intercept, yaitu nilai y ketika x = 0) dan b (slope, yaitu laju perubahan y terhadap x). Keunggulan Linear Regression adalah kesederhanaannya: hanya dua parameter yang perlu dihitung, komputasinya sangat cepat, dan hasilnya mudah diinterpretasikan secara fisis. Dalam konteks HVAC, persamaan Energy = 0.25T – 5 misalnya, dapat langsung diartikan bahwa setiap kenaikan suhu 1ยฐC akan meningkatkan konsumsi energi sebesar 0.25 kW.Polynomial Regression memperluas konsep Linear Regression dengan menambahkan suku-suku berderajat tinggi dari variabel x. Untuk orde 2 (Quadratic), persamaannya adalah y = a + bx + cxยฒ, sedangkan untuk orde 3 (Cubic) menjadi y = a + bx + cxยฒ + dxยณ. Setiap penambahan orde memberikan fleksibilitas lebih bagi model untuk mengikuti pola kurva yang lebih kompleks. Polynomial orde 2 menghasilkan kurva parabola, sehingga mampu merepresentasikan hubungan yang memiliki nilai maksimum atau minimum, seperti hubungan COP terhadap beban pendinginan yang mencapai puncak pada beban optimal kemudian menurun. Namun, setiap penambahan orde juga meningkatkan kompleksitas komputasi dan risiko overfitting.Pemilihan orde polinomial yang tepat merupakan tantangan tersendiri dalam praktik Curve Fitting. Orde yang terlalu rendah (underfitting) menghasilkan model yang tidak mampu menangkap pola data yang sesungguhnya, sehingga prediksi menjadi tidak akurat. Sebaliknya, orde yang terlalu tinggi (overfitting) menghasilkan model yang terlalu mengikuti noise dalam data sehingga kehilangan kemampuan generalisasi untuk data baru. Panduan umum yang digunakan adalah memilih orde terendah yang menghasilkan nilai Rยฒ yang memuaskan (mendekati 1.0) tanpa peningkatan signifikan yang diharapkan dari penambahan orde lebih tinggi. Validasi silang (cross-validation) dan analisis residual juga sering digunakan sebagai alat bantu dalam proses pemilihan model yang optimal.
III. METODE PENELITIAN
3.1 Jenis dan Pendekatan Penelitian
Penelitian ini menggunakan pendekatan kuantitatif berbasis analisis matematis dan komputasional. Data yang digunakan merupakan data eksperimen yang diperoleh dari pengukuran konsumsi energi sistem HVAC pada berbagai kondisi suhu udara luar, sebagaimana disajikan dalam modul perkuliahan DIN Pro Medium Mesin & HVAC. Pendekatan penelitian bersifat deskriptif-analitik, yaitu mendeskripsikan karakteristik data eksperimen kemudian menganalisisnya menggunakan metode Curve Fitting dan Least Squares Regression untuk menghasilkan model matematis yang representatif.Metodologi penelitian mengikuti alur sistematis yang dimulai dari pengumpulan data, pra-pemrosesan data (identifikasi tren dan penentuan jenis regresi yang sesuai), pembangunan model matematis menggunakan Normal Equations, evaluasi kualitas model menggunakan metrik statistik, dan akhirnya interpretasi hasil dalam konteks aplikasi HVAC. Pendekatan komputasional menggunakan dua platform utama: MATLAB dengan fungsi polyfit() dan Python dengan library NumPy, memungkinkan verifikasi silang hasil komputasi untuk memastikan keakuratan kalkulasi.Batasan penelitian ini mencakup data eksperimen dengan rentang suhu luar antara 28ยฐC hingga 37ยฐC dan konsumsi energi antara 1.2 kW hingga 3.0 kW. Asumsi yang digunakan adalah bahwa sistem HVAC beroperasi dalam kondisi steady-state, artinya efek transien dan perubahan beban internal ruangan tidak diperhitungkan dalam model awal ini. Pengembangan ke model dinamis yang memperhitungkan lebih banyak variabel (kelembaban, radiasi matahari, beban internal) diidentifikasi sebagai rekomendasi penelitian lanjutan.
3.2 Prosedur Perhitungan Manual (Contoh Linear Regression)
Prosedur perhitungan manual Linear Regression dimulai dengan penyusunan tabel data yang memuat kolom x (variabel independen), y (variabel dependen), xยฒ (kuadrat x), dan xy (hasil kali x dan y). Untuk setiap baris data, nilai xยฒ, dan xy dihitung dan dicatat. Selanjutnya, semua kolom dijumlahkan untuk mendapatkan ฮฃx, ฮฃy, ฮฃxยฒ, dan ฮฃxy. Sebagai contoh dari materi kuliah dengan n = 5 data points: x = {1, 2, 3, 4, 5} dan y = {2, 3, 5, 4, 6}, diperoleh ฮฃx = 15, ฮฃy = 20, ฮฃxยฒ = 55, dan ฮฃxy = 69.Nilai slope (b) dihitung menggunakan rumus: b = (nฮฃxy – ฮฃxฮฃy) / (nฮฃxยฒ – (ฮฃx)ยฒ) = (5ร69 – 15ร20) / (5ร55 – 15ยฒ) = (345 – 300) / (275 – 225) = 45/50 = 0.9. Nilai intercept (a) kemudian dihitung menggunakan: a = (ฮฃy – bฮฃx) / n = (20 – 0.9ร15) / 5 = (20 – 13.5) / 5 = 6.5/5 = 1.3. Dengan demikian, persamaan regresi linear yang dihasilkan adalah y = 1.3 + 0.9x, yang berarti bahwa untuk setiap penambahan satu satuan x, nilai y bertambah sebesar 0.9 satuan, dengan nilai dasar (baseline) sebesar 1.3 ketika x = 0.Untuk kasus Polynomial Regression orde 2, Normal Equations menghasilkan sistem tiga persamaan dengan tiga unknown (a, b, c) yang harus diselesaikan secara simultan. Sistem ini dapat dinyatakan dalam bentuk matriks [A]{x} = {b}, di mana matriks A memuat koefisien yang terdiri dari berbagai jumlah pangkat x (ฮฃx, ฮฃxยฒ, ฮฃxยณ, ฮฃxโด), vektor {x} memuat koefisien a, b, c yang dicari, dan vektor {b} memuat ฮฃy, ฮฃxy, ฮฃxยฒy. Sistem matriks ini diselesaikan menggunakan eliminasi Gaussian atau invers matriks pada komputer, karena penyelesaian manual untuk orde tinggi menjadi sangat kompleks dan rentan terhadap kesalahan kalkulasi.
3.3 Evaluasi Model dan Goodness of Fit
Kualitas model hasil Curve Fitting dievaluasi menggunakan dua metrik utama: Error individual (eแตข) dan Koefisien Determinasi (Rยฒ). Error individual didefinisikan sebagai selisih antara nilai data aktual dan nilai prediksi model: eแตข = yแตข – y_model. Analisis distribusi error memberikan informasi tentang pola ketidaksesuaian antara model dan data; error yang terdistribusi secara acak di sekitar nol mengindikasikan bahwa model telah menangkap tren data dengan baik, sedangkan pola sistematis dalam residual mengindikasikan bahwa model masih kurang tepat dan perlu direvisi.Koefisien Determinasi Rยฒ dihitung sebagai Rยฒ = 1 – (SS_res / SS_tot), di mana SS_res = ฮฃ(yแตข – y_model)ยฒ adalah Sum of Squares of Residuals dan SS_tot = ฮฃ(yแตข – ศณ)ยฒ adalah Total Sum of Squares (dengan ศณ sebagai rata-rata data). Nilai Rยฒ berkisar antara 0 dan 1, di mana nilai yang mendekati 1 menunjukkan bahwa model mampu menjelaskan sebagian besar variasi dalam data (model sangat baik), sementara nilai yang mendekati 0 menunjukkan bahwa model hampir tidak mampu menjelaskan variasi data (model buruk). Dalam praktik teknik, nilai Rยฒ โฅ 0.95 umumnya dianggap memuaskan untuk model prediksi.Selain Rยฒ, analisis residual plot (grafik eแตข terhadap x atau ลท) dan Mean Squared Error (MSE = SS_res/n) juga digunakan sebagai alat evaluasi tambahan. Pembandingan nilai Rยฒ dan MSE antara model Linear Regression dan Polynomial Regression untuk dataset yang sama memungkinkan pemilihan model terbaik secara objektif. Perlu dicatat bahwa peningkatan orde polinomial selalu meningkatkan Rยฒ (karena model memiliki lebih banyak parameter untuk ‘mengikuti’ data), sehingga peningkatan Rยฒ harus dievaluasi dengan mempertimbangkan trade-off terhadap kompleksitas model dan risiko overfitting.