sistem rekomendasi. Tentang pendidikan online, pro, kontra, dan perangkapnya

Ada dua strategi utama untuk membangun sistem pemberi rekomendasi: pemfilteran konten dan pemfilteran kolaboratif.

Pada penyaringan konten dibuat profil pengguna dan objek.

  • Profil pengguna dapat mencakup informasi demografis atau jawaban atas serangkaian pertanyaan tertentu.
  • Profil objek dapat mencakup nama genre, nama aktor, nama pemain, dan sebagainya. - tergantung pada jenis objek.

Pendekatan ini digunakan dalam proyek Proyek Genom Musik: Analis musik mengevaluasi setiap lagu berdasarkan ratusan karakteristik musik yang berbeda, yang dapat digunakan untuk mengungkapkan preferensi musik pengguna.

Pada penyaringan kolaboratif informasi tentang perilaku pengguna sebelumnya digunakan - misalnya, informasi tentang pembelian atau peringkat. Dalam hal ini, tidak masalah jenis objek apa yang sedang Anda kerjakan, tetapi karakteristik implisit dapat diperhitungkan, yang akan sulit untuk diperhitungkan saat membuat profil. Masalah utama dengan jenis sistem pemberi rekomendasi ini adalah "awal yang dingin": kurangnya data tentang pengguna atau objek yang baru saja muncul di sistem.

Metodologi

Contoh Pengumpulan Data Eksplisit

  • meminta pengguna untuk mengevaluasi objek pada skala yang berbeda;
  • meminta pengguna untuk memberi peringkat sekelompok objek dari yang terbaik hingga yang terburuk;
  • menghadirkan dua objek kepada pengguna dengan pertanyaan mana yang lebih baik;
  • saran untuk membuat daftar objek yang disukai pengguna.

Contoh pengumpulan data implisit

  • memantau apa yang dilihat pengguna di toko online atau jenis database lainnya;
  • memelihara catatan perilaku pengguna secara online;
  • melacak konten komputer pengguna;

Aplikasi

Sistem rekomendasi membandingkan jenis data yang sama dari orang yang berbeda dan menghitung daftar rekomendasi untuk pengguna tertentu. Beberapa contoh penggunaan komersial dan non-komersial mereka diberikan dalam artikel penyaringan kolaboratif. Sistem pemberi rekomendasi adalah alternatif yang nyaman untuk algoritme pencarian, karena memungkinkan Anda menemukan objek yang tidak dapat ditemukan terakhir kali. Anehnya, sistem pemberi rekomendasi sering menggunakan mesin pencari untuk mengindeks data yang tidak biasa.

  • Imhonet (film, sastra, foto)
  • Last.fm (musik)
  • Ozon (buku, CD, dll.)
  • Software Informan (perangkat lunak)
  • Lab Fiksi Ilmiah (situs web Fiksi Ilmiah dan Fantasi)
  • Imdb - film (situs web dalam bahasa Inggris)
  • Rechelper - film
  • Penasihat - tempat
  • Mir4 adalah sistem eksperimental yang mampu bekerja dengan konten apa pun, termasuk konten bersirkulasi kecil. Untuk saat ini, ini hanya berfungsi dengan berita.

Tautan

Catatan

literatur

  • Melville P., Mooney R., Nagarajan R. Pemfilteran Kolaboratif yang Didukung Konten untuk Rekomendasi yang Lebih Baik // Universitas Texas, AS: Bahan conf. / AAAI-02, Austin, TX, AS, 2002. - 2002. - S. 187-192.

Yayasan Wikimedia. 2010 .

    Cabang kegiatan ilmiah dan praktis, salah satu jenis bibliografi (Lihat Daftar Pustaka). Tujuan umum utama R. b. di Uni Soviet dan negara-negara sosialis lainnya untuk mempromosikan pendidikan umum dan kejuruan dan pendidikan mandiri ... Ensiklopedia Besar Soviet

    URL: http://imhonet.ru Komersial: Tidak Ada Jenis sa ... Wikipedia

    Artikel ini sedang aktif diedit oleh Anggota:Moshanin. Harap jangan membuat perubahan apa pun sampai pengumuman ini hilang. Jika tidak, konflik pengeditan dapat terjadi. Ini ... ... Wikipedia - Halaman ini diusulkan untuk diganti namanya menjadi Badan Energi Atom Internasional. Penjelasan alasan dan diskusi di halaman Wikipedia: Akan diganti namanya / 24 Juli 2012. Mungkin namanya saat ini tidak memenuhi standar modern ... Wikipedia

    DAFTAR PUSTAKA SASTRA ANAK- bagian bibliografi, yang tugasnya meliputi akuntansi dan informasi tentang karya cetak untuk anak-anak dan remaja. Informasi ini dikirim dalam dua utama alamat: orang dewasa (guru, orang tua, pendidik, profesional yang terkait dengan ... ... Ensiklopedia Pedagogis Rusia

    Perekonomian suatu negara- (Perekonomian nasional) Perekonomian negara adalah hubungan masyarakat untuk menjamin kekayaan negara dan kesejahteraan warganya Peran ekonomi nasional dalam kehidupan bernegara, hakekat, fungsi, sektor dan indikator perekonomian negara, struktur negara ... ... Ensiklopedia investor

    Likuiditas- (Likuiditas) Likuiditas adalah mobilitas aset, yang memastikan kemungkinan pembayaran kewajiban yang tidak terputus Karakteristik ekonomi dan rasio likuiditas suatu perusahaan, bank, pasar, aset dan investasi sebagai ekonomi penting ... ... Ensiklopedia investor

Pada tanggal 28 April 2016, kami secara resmi mengumumkan peluncuran kursus adaptif pertama di Stepic.org, yang memilih tugas Python tergantung pada level siswa. Sebelumnya, kami juga menerapkan pelajaran yang direkomendasikan di platform, sehingga siswa tidak akan melupakan apa yang telah mereka selesaikan dan menemukan topik baru yang mungkin menarik bagi mereka.

Di bawah potongan, ada dua topik utama:

  • tentang pendidikan online, pro/kontra/jebakan;
  • klasifikasi sistem pemberi rekomendasi, penerapannya dalam pendidikan, contoh.

Tentang pendidikan online, pro, kontra, dan perangkapnya

Bagian ini lebih bersifat pengantar, mencirikan pendidikan online, detail menarik dari sistem rekomendasi di bawah gambar berikut :)

Di dunia modern, pendidikan online secara bertahap menjadi semakin populer. Kesempatan untuk belajar dari profesor lembaga pendidikan terkemuka, untuk mempelajari bidang baru, untuk mendapatkan pengetahuan yang diperlukan untuk bekerja, tanpa meninggalkan rumah, menarik banyak orang.

Salah satu bentuk pembelajaran online yang paling umum adalah Massive Open Online Courses (MOOCs). Paling sering mereka menyertakan video, slide dan konten teks yang disiapkan oleh guru, serta tugas-tugas untuk pengujian pengetahuan, yang biasanya diperiksa secara otomatis, tetapi juga memungkinkan bagi siswa untuk memeriksa pekerjaan satu sama lain. Berbagai macam jenis tugas dapat ditawarkan sebagai tugas: dari pilihan sederhana jawaban yang benar hingga menulis esai, dan bahkan, seperti yang kami miliki di Stepik, memprogram tugas dengan verifikasi otomatis.

Pendidikan online memiliki ciri khas tersendiri yang membedakannya dengan pendidikan offline konvensional. Di antara kelebihannya, pertama, aksesibilitas yang telah disebutkan di atas kepada setiap orang yang memiliki akses ke Internet. Kedua, skalabilitasnya hampir tidak terbatas: berkat pemeriksaan tugas otomatis, ribuan orang dapat belajar di kursus pada saat yang sama, yang tidak dapat dibandingkan dengan kursus konvensional di ruang kelas. Ketiga, setiap siswa dapat memilih waktu dan kecepatan yang tepat untuk menyampaikan materi. Keempat, pendidik memiliki banyak data tentang bagaimana pengguna mengambil kursus mereka, yang dapat mereka gunakan untuk menganalisis dan meningkatkan materi mereka.

Pada saat yang sama, ada beberapa kelemahan dari pembelajaran online. Tidak seperti pendidikan tradisional, di mana siswa selalu memiliki motivasi dalam bentuk penilaian kinerja akademiknya, dalam kasus kursus online, tidak ada hukuman untuk tidak menyelesaikan kursus. Karena itu, proporsi mereka yang telah menyelesaikan kursus dari mereka yang mendaftar jarang melebihi 10% (di Stepik, kami memiliki kursus "Fundamentals of Statistics" Anatoly Karpov terbaik menurut EdCrunch Awards 2015, sebuah rekor 17% dari mereka yang mendaftar untuk peluncuran pertama, tetapi ini merupakan pengecualian). Selain itu, karena jumlah siswa yang banyak, guru tidak memiliki kesempatan untuk memberikan perhatian individual kepada setiap siswa sesuai dengan tingkat dan kemampuannya.


Kami menetapkan tugas untuk membuat sistem rekomendasi yang dapat memberi saran kepada siswa tentang konten yang menarik baginya dan memperhitungkan tingkat persiapan dan kesenjangan pengetahuannya. Selain itu, sistem harus dapat mengevaluasi kompleksitas konten. Ini diperlukan, khususnya, untuk rekomendasi adaptif yang akan membantu pengguna mempelajari materi, beradaptasi secara fleksibel dengannya, menawarkan konten yang dia butuhkan sekarang untuk belajar. Sistem seperti itu akan menguntungkan pengguna dengan rekomendasi pelajaran yang dipersonalisasi yang dapat membantu mereka mempelajari topik tertentu atau menyarankan sesuatu yang baru.

Secara umum, pembelajaran seharusnya menjadi lebih menarik!

Salah satu contoh modern pertama dari sistem pemberi rekomendasi adalah movielens.org, yang menyarankan film kepada pengguna berdasarkan preferensi mereka. Layanan ini menarik karena memberikan semua orang kumpulan data ekstensif tentang film dan peringkat yang diberikan kepada mereka oleh pengguna. Dataset ini telah digunakan dalam banyak penelitian pemberi rekomendasi selama dua dekade terakhir.

  • Sistem berdasarkan penyaringan konten. Sistem tersebut menawarkan pengguna konten yang mirip dengan apa yang telah mereka pelajari sebelumnya. Kemiripan dihitung dengan menggunakan karakteristik objek yang dibandingkan. Misalnya, Anda dapat menggunakan kedekatan genre atau pemeran untuk merekomendasikan film. Pendekatan ini digunakan dalam layanan untuk menilai, mencari dan merekomendasikan film Internet Movie Database.
  • Sistem menggunakan penyaringan kolaboratif. Dalam hal ini, pengguna ditawari konten yang menarik bagi pengguna serupa. Rekomendasi MovieLens didasarkan pada pendekatan ini.
  • Sistem hybrid menggabungkan dua pendekatan sebelumnya. Jenis sistem ini digunakan oleh Netflix, layanan untuk menonton film dan serial online.

Kami telah menciptakan sistem hibrida dengan penggunaan pemfilteran konten yang lebih aktif dan penggunaan pemfilteran kolaboratif yang kurang aktif.

Ada banyak penelitian tentang sistem rekomendasi untuk Pembelajaran yang Ditingkatkan Teknologi. Kekhususan tugas dalam hal ini menambah arah baru bagi pengembangan sistem rekomendasi.


Apa saja fitur dari sistem pemberi rekomendasi proyek pendidikan?

Pertama, kemampuan untuk membangun sistem rekomendasi adaptif yang akan beradaptasi dengan kebutuhan pengguna pada saat tertentu dan menawarkan cara terbaik untuk mempelajari materi. Dalam format ini, berbagai simulator dapat diimplementasikan, misalnya, dalam matematika atau bahasa pemrograman apa pun, yang berisi banyak tugas dengan kompleksitas yang berbeda-beda, di mana siswa yang berbeda akan cocok pada waktu tertentu.

Kedua, Anda dapat mengekstrak ketergantungan antara materi pelatihan dari data tentang bagaimana pengguna melewatinya.

Data ini dapat membantu mengekstrak topik individual dalam materi, hubungan antara topik-topik ini, hubungan mereka dalam kompleksitas.

Coursera, EdX, Udacity (platform pembelajaran online) menggunakan sistem rekomendasi mereka untuk memberi saran kepada pengguna tentang kursus yang mungkin mereka minati. Kerugian dari rekomendasi ini adalah mereka hanya dapat menawarkan seluruh kursus, tetapi tidak sebagian, bahkan jika pengguna hanya tertarik padanya. Selain itu, sistem yang dibangun dengan cara ini tidak dapat membantu pengguna dalam mempelajari program studi yang dipilihnya.

Sistem pemberi rekomendasi sumber daya MathsGarden, di sisi lain, bekerja dengan konten terkecil - tugas individu. Ini adalah simulator untuk aritmatika dasar untuk siswa sekolah dasar, yang menawarkan tugas siswa yang paling sesuai untuknya pada waktu tertentu dalam hal kompleksitas.
Untuk melakukan ini, sistem menghitung dan secara dinamis mengubah karakteristik relatif dari pengetahuan siswa, serta karakteristik kompleksitas tugas, tetapi lebih lanjut tentang ini nanti.

Dalam artikel berikut, kita akan berbicara lebih detail tentang perangkat Stepic.org dan implementasi sistem rekomendasi, mendefinisikan apa itu sistem rekomendasi adaptif, dan menganalisis hasilnya secara detail. Akan menyenangkan:)

Ketika sistem rekomendasi baru saja mulai diterapkan secara diam-diam pada berbagai sumber daya, hal itu tampak seperti tambahan yang bagus untuk proses pencarian mandiri. Ketika pilihan produk atau konten apa pun cukup besar, pencarian berubah menjadi perjalanan yang mengasyikkan dengan hasil yang seringkali tidak terduga. Misalnya, saya tidak pernah tertarik pada film horor, lebih memilih film dengan arah yang sedikit berbeda, namun, berkat konten yang acak-acakan, suatu hari saya menemukan film klasik. penghancur neraka, tampilan biasa yang meninggalkan kesan kuat dan tak terhapuskan pada saya. Saya yakin bahwa setiap pembaca setidaknya sekali memperkaya dirinya sendiri dalam arti budaya atau estetika justru berkat pencarian acak dan tindakan acak. Di sisi lain, saya menemukan banyak hal menarik untuk diri saya sendiri dengan bantuan rekomendasi yang diberikan oleh sumber tematik kepada saya. Banyak film, buku, musik atau produk menjadi dikenal saya (dan menarik) hanya karena keberhasilan pengoperasian sistem rekomendasi. Menariknya, sekarang saya hampir selalu mengandalkan rekomendasi dan lebih jarang mencari sesuatu sendiri, karena tidak ada waktu tersisa untuk yang terakhir!

Keadaan ini diperburuk oleh fakta bahwa saya melihat sejauh mana algoritme pemberi rekomendasi mulai memahami saya. Jika hit sukses sebelumnya tidak sering terjadi, hari ini setidaknya setengah dari hal-hal yang direkomendasikan menarik minat saya sampai tingkat tertentu. Dan ketika saya masih mencoba, alih-alih menerima apatis dari apa yang ditawarkan kepada saya, untuk menemukan sesuatu yang berharga dengan cara saya sendiri, saya dengan cepat menyerah di bawah tekanan kelimpahan yang luar biasa dan belum pernah terjadi sebelumnya. Dan semakin jauh, semakin jelas gambaran masa depan yang tidak begitu jauh muncul, ketika realitas di sekitarnya akan terus beradaptasi dengan kepribadian Anda, terus berubah dan belajar. Belum pernah sebelumnya dalam sejarah umat manusia kenyamanan begitu mutlak. Dan belum pernah ada celah untuk penemuan kebetulan yang luar biasa telah dihapus dari penggunaan begitu cepat dan pasti.

Menerima masa depan yang akan datang apa adanya, ada baiknya belajar mengevaluasinya secara kritis, mengidentifikasi sisi yang meragukan atau bahkan sisi gelap dengan semangat yang sama dengan yang kita coba untuk menggunakan inovasi dalam kehidupan sehari-hari yang membuat banyak kita lebih mudah. Mari kita coba memahami pokok pembicaraan kita hari ini.

Metode penyaringan yang digunakan dalam sistem pemberi rekomendasi

Penyaringan kolaboratif

Pemfilteran kolaboratif banyak digunakan, paling tidak karena relatif mudahnya implementasi. Prinsip pengoperasiannya memang sederhana, meski dapat dibagi menjadi dua pendekatan yang berbeda.

Pendekatan berbasis pengguna memperhitungkan kesamaan pengguna tertentu dengan pengguna lain yang terlibat dalam sistem. Misalnya, jika Vasily menilai positif Lady Gaga, Oasis dan Led Zeppelin, maka Anastasia yang mencintai Lady Gaga dan Led Zeppelin, mungkin akan mencoba menawarkan Oasis.

Konsep pencocokan objek (berbasis item, masing-masing), sebaliknya, menganalisis objek itu sendiri dan mengungkapkan kesamaannya dengan yang pernah disukai Vasily. Dalam praktiknya, terlihat seperti ini - Vasily pernah menyukai Radiohead dan Blur, mengapa kita tidak menawarkan Oasis juga padanya?

Pemfilteran kolaboratif memungkinkan Anda mendapatkan rekomendasi yang sangat akurat dan relevan berdasarkan analisis dan perbandingan perbedaan di antara pengguna dengan perilaku serupa.

Vasily dan Anastasia: rekomendasi otomatis timbal balik berdasarkan perbedaan preferensi.

Pemfilteran konten

Pemfilteran konten membangun tautan internal antara barang yang ditawarkan atau konten apa pun. Prinsip sederhana ini dimanifestasikan dalam rekomendasi kepada pengguna objek yang serupa dengan yang telah dia pilih sebelumnya. Misalnya, jika Anda membeli manual gitar di toko buku, Anda akan secara otomatis ditawari tutorial atau manual populer lainnya oleh penulis yang sama. Nilai tambah besar dari sistem pemberi rekomendasi yang menggunakan prinsip penyaringan konten adalah kemampuan untuk menarik minat pengguna baru dengan penawaran secara harfiah dari langkah konsumen pertamanya. Anda tidak perlu mengumpulkan data tentang preferensi seseorang untuk waktu yang lama, Anda dapat segera menyertakan pengunjung dalam bekerja dengan sumber daya. Juga, keuntungan penting dari pemfilteran konten adalah kemampuan untuk merekomendasikan kepada pengguna objek-objek yang tidak dihargai dan dilewati oleh pengguna lain. Poin terakhir sering terjadi ketika menggunakan metode kolaboratif.

Pemfilteran konten sepenuhnya mengabaikan pendapat pengguna tentang objek tertentu. Dengan membangun koneksi murni antara objek itu sendiri, kami memiliki kesempatan untuk secara instan, tanpa mengumpulkan peringkat dan informasi pribadi tambahan, menawarkan seseorang sesuatu yang mirip dengan posisi yang menarik baginya. Dengan mengecualikan pengalaman pengguna dari sistem pemberi rekomendasi sebagai substansi fundamental, kami tampaknya memecahkan masalah yang disebut. "mulai dingin", ketika kelangkaan data pengguna mencegah sistem menghasilkan rekomendasi yang dipersonalisasi. Namun, kelemahan dari pemfilteran konten sama sekali tidak pantas, dan terkadang rekomendasi yang konyol seperti “Apakah Anda membeli Toyota RAV4? Anda mungkin juga tertarik dengan Toyota Highlander!”

Kesulitan lain yang terkait dengan penggunaan prinsip penyaringan konten adalah jumlah pekerjaan yang mengesankan untuk membangun hubungan antara semua objek dalam sistem. Namun kelemahan utama dari metode ini dinyatakan dalam sangat rendah, dan kadang-kadang cukup kondisional, mengenai sasaran. Pemfilteran konten tidak menyiratkan personalisasi tingkat tinggi, sehingga keakuratan rekomendasi relatif rendah.

Penyaringan Berbasis Pengetahuan (Pengetahuanberdasarkan sistem)

Sistem jenis ini banyak digunakan di toko online. Pada dasarnya, rekomendasi berbasis pengetahuan mirip dengan metode penyaringan konten sebelumnya, namun algoritma tersebut menggunakan analisis objek yang lebih dalam, membangun koneksi di antara mereka tidak sesuai dengan kriteria kesamaan dangkal, tetapi berdasarkan keterkaitan kelompok produk tertentu.

Dalam praktiknya, terlihat seperti ini - saat membeli, misalnya, ponsel cerdas, situs tersebut menawarkan aksesori yang sesuai untuk digunakan dengan perangkat baru Anda. Itu bisa berupa cover, headphone, kartu memori, dan lain-lain. Anda juga dapat merangsang pembeli dengan memberikan diskon untuk aksesori, yang bisa sangat berguna sehubungan dengan pembelian perangkat baru.

Rekomendasi berbasis pengetahuan menunjukkan hasil yang baik, meningkatkan omset platform perdagangan jaringan besar hingga puluhan persen. Selain itu, tidak seperti pemfilteran konten, jenis rekomendasi ini sangat akurat, menawarkan apa yang mungkin benar-benar dibutuhkan pengguna.

Jika Anda tertarik dengan rekomendasi yang akurat, maka Anda harus mempertimbangkan untuk menerapkan sistem berbasis pengetahuan pada sumber daya Anda. Seperti pemfilteran konten, sistem pemberi rekomendasi berbasis pengetahuan mempelajari dan menganalisis hubungan antara objek (produk), tetapi, selain itu, sistem ini mempertimbangkan sejumlah opsi tambahan yang terkait dengan properti individu dari pengguna tertentu.

a) Keinginan pengguna. Situasi yang akrab bagi semua orang - situs meminta pengguna untuk menunjukkan karakteristik yang diinginkan, setelah itu menawarkan produk yang sesuai dengan permintaan.

Yandex.Market dan kotak centangnya adalah contoh bagus dan mencolok dari sistem rekomendasi yang dipandu oleh persyaratan pengguna.

b) Fitur demografis. Sebenarnya, jejaring sosial terbesar, seperti Facebook, LinkedIn, Vkontakte, dan lainnya, menggunakan data demografis untuk membuat rekomendasi.

Tentu saja, untuk menerapkan sistem seperti itu, Anda harus bekerja keras - Anda harus mengumpulkan dan memproses sejumlah besar data.

Filtrasi Hibrida

Alat yang paling kuat dan sulit untuk diimplementasikan. Rupanya, masa depan justru terletak pada kombinasi berbagai mekanisme pemberi rekomendasi menjadi satu algoritma yang kuat. Kenyamanan mutlak dan realitas yang dipersonalisasi yang kita bicarakan di awal artikel akan diwujudkan dengan bantuan hibrida dari metode rekomendasi yang paling efektif.

Contoh seperti itu diberikan oleh Netflix, yang sistem rekomendasi hibridnya yang kompleks, yang menunjukkan akurasi unik, terus ditingkatkan dan dimodernisasi. Pengembangan algoritme yang begitu kuat sebagian besar disebabkan oleh pendanaan penelitian yang murah hati di bidang ini oleh Netflix sendiri, yang pada tahun 2006 menawarkan $1.000.000 untuk meningkatkan sistem rekomendasinya sebesar 10%.

Tim pengembangan Pragmatic Chaos BellKor, yang berhasil meningkatkan algoritmeNetflixsebesar 10,09%.

Beberapa kata tentang langkah-langkah praktis sebagai kesimpulan

Pilihan jenis penyaringan tertentu atau kombinasi beberapa metode secara langsung tergantung pada dua faktor - kompleksitas proyek Anda dan jumlah pendanaannya. Misalnya, membuat algoritme untuk sistem tematik, berpotongan blog adalah tugas yang relatif sederhana dan cukup mahal. Proyek yang lebih besar dan lebih heterogen, seperti toko online, lebih mahal, terutama jika tujuannya adalah untuk meningkatkan konversi dengan jumlah yang sangat signifikan. Sebagai aturan, dalam proyek semacam itu tidak mungkin untuk membatasi diri pada satu jenis algoritme pemberi rekomendasi dan seseorang harus menggunakan pemfilteran hibrid, sebagai akibatnya biaya dan kompleksitas pengembangan meningkat sesuai urutan besarnya.

Untuk membuat, mengimplementasikan, dan men-debug algoritme hibrida, Anda memerlukan seluruh tim pengembang berpengalaman yang sangat memahami apa itu aljabar linier dan relasional, dan juga memiliki sejumlah keterampilan yang membuat pembuat algoritme pemberi rekomendasi hampir menjadi profesi yang terpisah.

Dengan satu atau lain cara, ketika mengembangkan proyek yang menawarkan pengguna kesempatan untuk memilih objek tertentu dari set umum, perlu untuk memperhitungkan kemajuan pesat dalam kegunaan di semua bidang kehidupan manusia - mulai dari mengoptimalkan tidur menggunakan perangkat yang menganalisis semua proses yang terjadi dalam mimpi dan mengeluarkan rekomendasi untuk memperbaikinya, hingga pemilihan otomatis barang sehari-hari berdasarkan kebutuhan pengguna saat ini. Seperti yang Anda ketahui, kondisi yang sangat diperlukan untuk keberhasilan setiap usaha adalah kepatuhan yang tepat dengan semangat zaman.

Mari kita mulai dengan mendefinisikan apa itu sistem pemberi rekomendasi. Ini adalah program dan layanan yang mencoba menentukan apa yang ingin dilihat pengguna dan memberikannya kepada mereka (atau merekomendasikannya, itulah namanya). Masing-masing dari kita pasti pernah menjumpai trik serupa di berbagai situs. Hari ini kami akan menjelaskan jenis, prinsip pengoperasian program tersebut, dan juga memberikan contoh dari algoritma ini dalam tindakan. Baca sampai habis, pasti menarik!

Di atas kami menjelaskan apa itu sistem rekomendasi, sekarang kami akan berbicara lebih detail tentang betapa pentingnya mereka. Program-program ini telah meningkatkan cara situs berinteraksi dengan pengunjung karena alih-alih memberikan informasi statis, pengguna mendapatkan pengalaman interaktif.

Rekomendasi dibuat secara terpisah untuk setiap orang, berdasarkan tindakan mereka sebelumnya pada sumber daya web tertentu atau berdasarkan aktivitas sebelumnya. Selain itu, perilaku peserta sebelumnya dalam proses juga penting.

Untuk toko online, ini pada prinsipnya adalah fungsi penting, dan untuk katalog besar seperti Amazon, ini adalah salah satu dari sedikit cara untuk bekerja secara efisien. Metode rekomendasi dalam hal ini bukanlah opsi tambahan biasa; metode ini memberikan kemudahan navigasi pengguna melalui sumber daya web. Jika katalog elektronik berisi lebih dari 20.000 nama produk, orientasinya sudah tampak sangat sulit, apa yang bisa saya katakan jika ada jutaan produk?

Seberapa melelahkan calon pembeli berinteraksi dengan situs semacam itu? Jawabannya jelas. Dan widget untuk mencari produk yang secara visual mirip dengan yang Anda cari, atau milik grup produk yang sama, atau produk pelengkap (ketika sepasang sepatu ditawarkan untuk memilih tas tangan, misalnya) datang untuk menyelamatkan. Keputusan ini tidak hanya meningkatkan jumlah tampilan, tetapi juga memiliki efek positif pada konversi.

Seperti yang ditunjukkan oleh praktik, tidak hanya toko online yang menggunakan teknik ini. Media sosial juga tidak ketinggalan. Di bawah ini adalah contoh dari VKontakte.

Juga, teknik seperti itu dapat dengan mudah dilihat di berbagai platform sosial, portal yang didedikasikan untuk sastra, perjalanan, sumber berita, toko online, singkatnya - hampir di mana-mana. Teknik ini benar-benar sangat populer. Sumber daya web Kinopoisk adalah contoh lain yang dapat diakses.

Teknik

Jadi, tipe pertama adalah pengumpulan data eksplisit. Seperti yang Anda duga dari namanya, pengguna sendiri menyediakan bahan yang diperlukan untuk pekerjaan itu. Misalnya, ketika sistem rekomendasi Yandex atau mesin pencari lainnya meminta seseorang untuk menilai berbagai elemen, membuat daftar favorit di area tertentu, atau menjawab beberapa pertanyaan. Jika seseorang menolak untuk memberikan informasinya sendiri, teknik berikut akan relevan.

Tipe kedua adalah pengumpulan data implisit. Secara relatif, ini adalah misi mata-mata, yang menurutnya tindakan peserta proses direkam oleh program untuk diproses dan diterapkan lebih lanjut. Apa yang dibutuhkan untuk ini? Program ini mengenali pembelian, peringkat di situs, mengumpulkan informasi tentang tampilan, komentar. Tentu saja, pemilihan teknik seperti itu menyebabkan beberapa masalah etika, karena perlindungan data pribadi adalah salah satu persyaratan utama mesin pencari oleh pengguna. Tetapi meskipun faktanya tetap ada - semacam pengawasan mungkin dilakukan, dan pengunjung situs biasa tidak dapat memeriksa apakah peristiwa seperti itu benar-benar terjadi.

Teknik dasar pertama disebut penyaringan kolaboratif. Rekomendasi menggunakan teknik ini dikeluarkan berdasarkan karakteristik perilaku satu orang atau sekelompok orang, yang terakhir bahkan lebih efektif. Kelompok mengumpulkan orang-orang yang mirip satu sama lain dalam perilaku dan karakteristik.

Mari kita beri contoh untuk membuat informasi lebih mudah dipahami. Sebuah situs web sedang dibuat di mana karya musik akan direkomendasikan kepada penonton. Bagaimana layanan rekomendasi berdasarkan metodologi kolaboratif bekerja dalam kasus ini? Menurut prinsip ini: satu komunitas akan diambil sebagai dasar, di mana peserta menambahkan trek dari genre yang sama ke daftar putar. Selanjutnya, yang paling populer dari semua bagian musik ditentukan dan direkomendasikan untuk satu pengguna dari grup yang belum mendengarkan melodi ini.

Pendekatan kedua disebut penyaringan berbasis konten. Di sini rekomendasi dibentuk atas dasar perilaku manusia. Saat menggunakan pendekatan ini, riwayat penelusuran peserta tertentu juga dapat diambil sebagai dasar.

Kali ini kami akan memberikan contoh dengan majalah online tematik. Jadi, dalam kasus di mana seseorang sebelumnya membaca materi tentang bersepeda gunung dan secara teratur mengomentari artikel blog dari konten tersebut, maka metode penyaringan konten akan menggunakan informasi masa lalu ini untuk mengidentifikasi sumber daya serupa dan menawarkannya sebagai rekomendasi kepada pengguna ini.

Ada juga pendekatan campuran, yang sesuai dengan pengembangan sistem rekomendasi.

Pendekatan campuran adalah kombinasi dari kolaboratif dan penyaringan konten. Seperti yang Anda ketahui, lebih banyak lebih baik, jadi menggabungkan kedua metode ini meningkatkan efektivitas sistem rekomendasi, yaitu, mereka secara signifikan meningkatkan akurasi prakiraan untuk orang-orang tertentu.

algoritma

Korelasi Pearson

Algoritme ini memungkinkan Anda untuk menyoroti karakteristik umum di antara banyak pengguna. Bagaimana? Dengan bantuan matematika sederhana, yaitu definisi hubungan linier antara dua unsur. Poin penting - teknik ini tidak cocok untuk komunitas orang.

Kekelompokan

Prinsip pengoperasian sistem rekomendasi ini didasarkan pada penyorotan kesamaan antara elemen (pengguna) dengan menghitung kedekatannya satu sama lain dalam apa yang disebut ruang fitur. Tanda adalah elemen-elemen di mana kepentingan peserta tertentu dalam proses bertemu (untuk sumber musik, ini adalah trek, untuk portal film, film). Pengguna dengan karakteristik serupa dikelompokkan ke dalam apa yang disebut cluster.

Algoritma Penyaringan Kolaboratif

Pengelompokan keras dapat digantikan oleh algoritme lain yang bekerja sesuai dengan rumus yang agak rumit, dan, seperti semua yang sebelumnya, didasarkan pada perilaku pengguna dari grupnya. Namun, teknik ini memiliki beberapa kelemahan yang cukup signifikan. Pertama, sulit bagi pengguna baru atau atipikal (mereka yang tidak mengelompokkan bersama) untuk menemukan rekomendasi. Kedua, apa yang disebut "awal dingin", ketika objek baru tidak masuk ke sistem rekomendasi.

Algoritma Penyaringan Konten

Algoritmanya simetris dengan yang sebelumnya, tetapi jika dalam kasus pertama kita mulai dari asumsi bahwa pengguna akan menyukai objek karena "teman sekelasnya" menyukainya, maka di sini kami akan merekomendasikan berdasarkan objek serupa yang telah dia catat untuk diri. Dan di sini, secara tradisional, beberapa masalah dapat diidentifikasi. "Mulai dingin" yang sama dan fakta bahwa rekomendasi sering kali biasa-biasa saja.

Alih-alih sebuah kesimpulan

Jadi, kami telah memberikan semua informasi yang harus diketahui oleh pemula atau orang awam tentang sistem rekomendasi. Jujur saja, algoritme agak sulit bagi orang yang tidak siap, jadi tidak ada rumus matematika dalam artikel ini, meskipun algoritme didasarkan pada mereka.

Program rekomendasi adalah layanan yang berguna bagi pengguna Internet biasa dan peneliti serta pebisnis online. Mereka yang ingin meningkatkan konversi dan jumlah tampilan harus memperhatikan teknik ini dan pastikan untuk menerapkannya untuk meningkatkan efisiensi sumber daya web, terutama toko online.