Sentiment Analysis: A Definitive Guide

Opinion mining là gì

Opinion mining là gì

Video Opinion mining là gì

Phân tích cảm tính (hoặc khai thác ý kiến) là một kỹ thuật xử lý ngôn ngữ tự nhiên (nlp) được sử dụng để xác định xem dữ liệu là tích cực, tiêu cực hay trung lập. Phân tích tình cảm thường được thực hiện trên dữ liệu văn bản để giúp doanh nghiệp theo dõi tình cảm thương hiệu và sản phẩm trong phản hồi của khách hàng và hiểu nhu cầu của khách hàng.

Bạn Đang Xem: Sentiment Analysis: A Definitive Guide

Tìm hiểu thêm về cách hoạt động của phân tích cảm tính, những thách thức và cách sử dụng phân tích này để cải thiện quy trình, quá trình ra quyết định, sự hài lòng của khách hàng, v.v.

Sau khi bạn đã quen thuộc với những kiến ​​thức cơ bản, hãy bắt đầu với các công cụ phân tích cảm tính dễ sử dụng, sẵn sàng sử dụng ngay khi lấy ra khỏi hộp.

  1. Phân tích tình cảm là gì?
  2. Các loại phân tích tình cảm
  3. Tại sao phân tích cảm tính lại quan trọng?
  4. Ví dụ về phân tích tình cảm & phân tích các bài đánh giá của Trustpilot
  5. Phân tích cảm tính hoạt động như thế nào?
  6. Thử thách phân tích tình cảm
  7. Ứng dụng phân tích tình cảm
  8. Hướng dẫn về công cụ phân tích tình cảm
  9. Các khóa học và nghiên cứu phân tích tình cảm
  10. Phân tích tình cảm là gì?

    Phân tích tình cảm là quá trình phát hiện tình cảm tích cực hay tiêu cực trong văn bản. Các doanh nghiệp thường sử dụng nó để phát hiện tình cảm trong dữ liệu xã hội, đánh giá danh tiếng thương hiệu và hiểu khách hàng.

    Các loại phân tích tình cảm

    Phân tích tình cảm tập trung vào tính phân cực của văn bản (tích cực, tiêu cực, trung lập), nhưng nó cũng vượt ra ngoài tính phân cực để phát hiện những cảm xúc và cảm xúc cụ thể (tức giận, vui, buồn, v.v.), mức độ khẩn cấp (khẩn cấp, không khẩn cấp) Thậm chí ý định (quan tâm và không quan tâm).

    Tùy thuộc vào cách bạn muốn diễn giải phản hồi và thắc mắc của khách hàng, bạn có thể xác định và tùy chỉnh các danh mục để đáp ứng nhu cầu phân tích cảm tính của mình. Trong thời gian chờ đợi, đây là một số loại phân tích cảm tính phổ biến nhất:

    Phân tích tình cảm được phân loại

    Nếu độ chính xác của các cực là quan trọng đối với doanh nghiệp của bạn, thì bạn có thể xem xét mở rộng danh mục các cực để bao gồm các mức độ tích cực và tiêu cực khác nhau:

    • Rất tích cực
    • Mặt trước
    • Trung lập
    • Phủ định
    • Rất tiêu cực
    • Điều này thường được gọi là xếp hạng hoặc phân tích cảm tính chi tiết và có thể được sử dụng để giải thích xếp hạng 5 sao trong các bài đánh giá, ví dụ:

      • Rất tích cực = 5 sao
      • Rất tiêu cực = 1 sao
      • Phát hiện cảm xúc

        Phát hiện tâm trạng Phân tích cảm xúc cho phép bạn phát hiện những cảm xúc vượt quá sự phân cực, chẳng hạn như hạnh phúc, thất vọng, tức giận và buồn bã.

        Nhiều hệ thống phát hiện cảm xúc sử dụng từ điển (tức là danh sách các từ và cảm xúc mà chúng truyền đạt) hoặc các thuật toán máy học phức tạp.

        Một trong những nhược điểm của việc sử dụng từ điển là mọi người thể hiện cảm xúc theo những cách khác nhau. Những từ thường thể hiện sự tức giận, như tồi tệ hoặc tiêu cực (ví dụ: sản phẩm của bạn thật tệ, hoặc bộ phận hỗ trợ khách hàng của bạn khiến tôi phát điên) cũng có thể thể hiện sự hạnh phúc (ví dụ: điều này thật tệ, hoặc bạn đang giết nó).

        Phân tích cảm tính dựa trên khía cạnh

        Thông thường, khi phân tích cảm xúc của một văn bản, bạn muốn biết những khía cạnh hoặc đặc điểm cụ thể nào đã được đề cập theo cách tích cực, trung lập hoặc tiêu cực.

        Đây là lúc phân tích cảm tính dựa trên khía cạnh có thể giúp ích, chẳng hạn như trong bài đánh giá sản phẩm này: “Thời lượng pin của máy ảnh này quá ngắn”, bộ phân loại dựa trên khía cạnh sẽ có thể xác định rằng câu đó thể hiện cảm xúc đối với sản phẩm liên quan Tuổi thọ pin.

        Phân tích cảm tính đa ngôn ngữ

        Việc phân tích cảm tính đa ngôn ngữ có thể khó khăn. Nó liên quan đến rất nhiều tiền xử lý và tài nguyên. Hầu hết các tài nguyên này đều có sẵn trực tuyến (chẳng hạn như từ điển cảm tính), trong khi những tài nguyên khác cần được tạo (chẳng hạn như kho dịch thuật hoặc thuật toán phát hiện tiếng ồn), nhưng bạn cần biết cách viết mã để sử dụng chúng.

        Ngoài ra, bạn có thể sử dụng bộ phân loại ngôn ngữ để tự động phát hiện ngôn ngữ trong văn bản, sau đó đào tạo mô hình phân tích cảm tính tùy chỉnh để phân loại văn bản theo ngôn ngữ bạn chọn.

        Bằng cách tự động phân tích phản hồi của khách hàng, chẳng hạn như phản hồi khảo sát và ý kiến ​​trong các cuộc trò chuyện trên mạng xã hội, các thương hiệu có thể tìm hiểu điều gì khiến khách hàng thất vọng hoặc khó chịu để họ có thể điều chỉnh sản phẩm và dịch vụ cho phù hợp với nhu cầu của họ.

        Ví dụ: sử dụng tính năng phân tích cảm tính để tự động phân tích hơn 4.000 câu trả lời mở từ một cuộc khảo sát về mức độ hài lòng của khách hàng có thể giúp bạn khám phá lý do tại sao khách hàng hài lòng hoặc không hài lòng ở mỗi giai đoạn trong hành trình của khách hàng.

        Có thể bạn muốn theo dõi tình cảm thương hiệu để có thể phát hiện ngay những khách hàng không hài lòng và phản hồi nhanh nhất có thể. Có thể bạn muốn so sánh cảm tính từ quý này sang quý khác để xem liệu có cần phải hành động hay không. Sau đó, bạn có thể tìm hiểu sâu hơn về dữ liệu định tính của mình để hiểu tại sao tình cảm giảm hoặc tăng.

        Lợi ích tổng thể của phân tích cảm tính bao gồm:

        • Sắp xếp dữ liệu theo tỷ lệ
        • Bạn có tưởng tượng được việc sắp xếp thủ công hàng nghìn tweet, cuộc trò chuyện hỗ trợ khách hàng hoặc khảo sát không? Quá nhiều dữ liệu kinh doanh cần được xử lý thủ công. Phân tích tình cảm giúp doanh nghiệp xử lý một lượng lớn dữ liệu phi cấu trúc một cách hiệu quả và tiết kiệm chi phí.

          • Phân tích thời gian thực
          • Phân tích cảm tính có thể xác định các vấn đề quan trọng trong thời gian thực, chẳng hạn như một cuộc khủng hoảng PR trên mạng xã hội có bị thổi phồng quá mức không? Một khách hàng tức giận sắp rời đi? Các mô hình phân tích tình cảm có thể giúp bạn xác định những tình huống này ngay lập tức để bạn có thể hành động ngay lập tức.

            • tiêu chuẩn nhất quán
            • Người ta ước tính rằng khi xác định tình cảm của một văn bản cụ thể, mọi người chỉ đồng ý khoảng 60-65%. Việc gán nhãn văn bản theo tình cảm mang tính chủ quan cao, được truyền cảm hứng từ kinh nghiệm, suy nghĩ và niềm tin cá nhân.

              Bằng cách sử dụng hệ thống phân tích cảm tính tập trung, các công ty có thể áp dụng cùng một tiêu chuẩn cho tất cả dữ liệu của họ, giúp họ cải thiện độ chính xác và hiểu rõ hơn.

              Các ứng dụng của phân tích tình cảm là vô tận. Vì vậy, để giúp bạn hiểu cách phân tích cảm tính có thể mang lại lợi ích cho doanh nghiệp của bạn, hãy xem xét một số ví dụ về văn bản có thể được phân tích bằng cách sử dụng phân tích cảm tính.

              Sau đó, chúng ta sẽ chuyển sang một ví dụ thực tế về cách thức công ty cung cấp vật nuôi cho thú cưng đã hiểu rõ hơn (và hữu ích!) về các bài đánh giá của mình bằng cách áp dụng phân tích cảm tính.

              Ví dụ về phân tích tình cảm

              Để hiểu mục tiêu và thách thức của việc phân tích cảm tính, đây là một số ví dụ:

              Ví dụ cơ bản về dữ liệu phân tích tình cảm

              • netflix có tuyển tập phim hay nhất
              • Giao diện người dùng của hulu thật tuyệt vời
              • Tôi không thích loạt tội phạm mới
              • Tôi ghét phải đợi tập tiếp theo ra mắt
              • Một ví dụ phân tích tình cảm khó khăn hơn

                • Tôi không ghét phim kinh dị. (với câu phủ định)
                • Việc không thích phim kinh dị không phải là hiếm. (Phủ định, đảo ngược thứ tự)
                • Đôi khi tôi thực sự ghét chương trình này. (Trạng từ bổ nghĩa cho cảm xúc)
                • Tôi thích đợi hai tháng cho loạt phim tiếp theo! (mỉa mai)
                • Tập cuối gây bất ngờ với một bước ngoặt khủng khiếp ở cuối (một thuật ngữ tiêu cực được sử dụng theo cách tích cực)
                • Bộ phim này rất dễ xem, nhưng tôi sẽ không giới thiệu nó cho bạn bè của mình. (khó phân loại)
                • Tôi đã cười thành tiếng khi kết thúc cảnh chiếc bánh (thường khó hiểu các thuật ngữ mới)
                • Bây giờ, chúng ta hãy xem một số đánh giá thực tế về trustpilot để xem công cụ phân tích tình cảm hoạt động tốt như thế nào về mặt nhận dạng và phân loại khỉ.

                  Nghiên cứu điển hình: Phân tích cảm tính của các bài đánh giá của phi công đáng tin cậy

                  chewy là một công ty cung cấp vật nuôi – một ngành có tính cạnh tranh cao, vì vậy việc mang lại trải nghiệm khách hàng tuyệt vời (cx) cho khách hàng của mình có thể tạo ra sự khác biệt lớn.

                  Do đó, các bài đánh giá trực tuyến có thể là một nguồn thông tin vô cùng quý giá để thu thập thông tin chi tiết về khách hàng nhằm cải thiện trải nghiệm của khách hàng. dainy có hàng nghìn bài đánh giá trên trustpilot, đây là kho lưu trữ bài đánh giá của họ:

                  Bằng cách tin tưởng phi công

                  Chỉ từ điều này, thật dễ dàng để rút ra kết luận chung về thành công tương đối của nhai – 82% phản hồi rất tốt là một điểm khởi đầu tốt.

                  Nhưng nếu mục tiêu của nhai là cải thiện dịch vụ của mình, thì chỉ kết quả của trustpilot thôi là chưa đủ. Phần tổng quan chiếu lệ này không cung cấp những hiểu biết sâu sắc có thể hành động, nền tảng và mục tiêu cuối cùng của việc phân tích tình cảm hiệu quả.

                  Nếu nhai muốn hiểu nguyên nhân và lý do đằng sau các bài đánh giá của họ để cải thiện hơn nữa dịch vụ của mình, thì họ sẽ cần phân tích từng bài đánh giá tiêu cực ở cấp độ chi tiết.

                  Tuy nhiên, với một công cụ phân tích tình cảm, nhai có thể đưa vào 5.639 bài đánh giá của phi công tin cậy (vào thời điểm đó) để có thông tin chi tiết phân tích tình cảm tức thì.

                  Chúng tôi đã tải lên và phân tích các bài đánh giá của nhai vào xưởng trực quan và phân tích dữ liệu tất cả trong một của Monkeylearn để tạo ra các trang tổng quan sau:

                  Mẫu bài đánh giá đáng tin cậy

                  Vui lòng nhấp vào liên kết này để xem kết quả khi rảnh rỗi – vì trang tổng quan mẫu này là bản trình diễn công khai, bạn có thể nhấp qua và tự mình khám phá các đầu vào và bộ lọc.

                  Mặc dù còn nhiều điều cần khám phá, nhưng trong phân tích này, chúng tôi sẽ tập trung vào bốn kết quả trực quan hóa dữ liệu phân tích cảm tính mà trang tổng quan hiển thị cho chúng tôi.

                  1. Tâm trạng chung
                  2. Cảm xúc theo thời gian
                  3. Điểm cảm xúc
                  4. Tình cảm chủ đề
                  5. 1. Tâm trạng chung

                    Chúng ta sẽ bắt đầu bằng cách trích xuất đồ họa có liên quan từ bảng điều khiển ở trên.

                    Bạn sẽ nhận thấy rằng những kết quả này rất khác so với tổng quan của Trustpilot (82% xuất sắc, v.v.). Điều này là do tính năng phân tích tình cảm của Monkeylearn thực hiện phân tích tình cảm nâng cao, phân tích cú pháp từng câu nhận xét.

                    Những gì bạn còn lại là đánh giá chính xác mọi thứ mà khách hàng của bạn đã viết, chứ không phải một danh sách sao đơn giản. Phân tích này có thể xác định chính xác các điểm ma sát với độ chính xác và chi tiết cao hơn.

                    Đọc cách hoạt động của phân tích cảm tính bên dưới.

                    2. Tình cảm theo thời gian

                    Đây là bản đồ cảm tính tiện dụng của chúng tôi theo thời gian, được phóng to:

                    Ví dụ về hình ảnh hóa dữ liệu này là hình ảnh trực quan hóa dữ liệu theo thời gian cổ điển, một loại hình trực quan hóa dữ liệu theo dõi kết quả và vẽ đồ thị theo thời gian.

                    Xem Thêm: Trình tạo Tóm tắt: Nhận Bản tóm tắt Nhanh Bất kỳ Văn bản Miễn phí

                    Biểu đồ này mở rộng dựa trên dữ liệu cảm tính tổng thể của chúng tôi – biểu đồ này theo dõi tỷ lệ tổng thể của cảm xúc tích cực, trung lập và tiêu cực trong các bài đánh giá từ năm 2016 đến năm 2021.

                    Biểu đồ này cho thấy sự thay đổi dần dần về nội dung nhận xét bằng văn bản của họ trong khoảng thời gian 5 năm. Ví dụ: các phản hồi tiêu cực đã giảm từ năm 2019 xuống 2020, trước khi quay trở lại mức trước đó vào năm 2021.

                    3. Chấm điểm tình cảm

                    Bây giờ, chúng ta chuyển sang kết quả ban đầu về việc neo cảm xúc dựa trên văn bản của chúng ta vào phi công đáng tin cậy.

                    Bằng cách xếp hạng từng hạng mục phi công tin cậy từ 1-kém đến 5-xuất sắc và chia nhỏ văn bản của các bài đánh giá theo điểm số, bạn có thể đi đến biểu đồ trên.

                    Nhìn vào kết quả và tìm hiểu sâu hơn về các nhận xét bằng phân tích cảm tính, chúng ta có thể rút ra ngay một số kết luận thú vị.

                    1. Kết quả của trustpilots không phải là vô ích – các bài đánh giá càng tốt thì tỷ lệ cảm nhận tích cực càng cao, trong khi các bài đánh giá càng tệ thì càng có nhiều cảm nhận tiêu cực. Tuy nhiên, tất cả các bình luận đều chứa đựng một chút cảm xúc thuộc mọi loại – chúng tôi biết rằng các bình luận của chúng tôi rất tế nhị và do đó có thể ẩn chứa nhiều hiểu biết sâu sắc hơn về chúng tôi!
                    2. Các bài đánh giá của chúng tôi có sự phân cực. Con số của họ thiên về 5 và 1.
                    3. Những bản tóm tắt nhanh này chỉ cho chúng ta những mỏ vàng để phân tích trong tương lai. Cụ thể, một phần tình cảm tích cực của đánh giá tiêu cực và một phần tiêu cực của đánh giá tích cực, và 2 – 4 đánh giá (tại sao họ cảm thấy như vậy và làm cách nào chúng ta có thể cải thiện điểm số của họ?).

                      4. Tình cảm chủ đề

                      Cuối cùng, chúng ta có thể xem xét cảm tính theo chủ đề để bắt đầu chứng minh rằng phân tích cảm tính cho phép chúng ta tìm hiểu sâu hơn về dữ liệu.

                      Ngoài phân tích cảm tính, hình ảnh trên còn áp dụng phân loại văn bản liên quan đến sản phẩm để ghép một cảm xúc nhất định với các đặc điểm cụ thể của sản phẩm/dịch vụ, được gọi là phân tích cảm tính dựa trên khía cạnh.

                      Điều này có nghĩa là chúng tôi có thể hiểu cảm giác của khách hàng, giúp chúng tôi tập trung vào và giải quyết một vấn đề hoặc điểm khó khăn cụ thể.

                      Đây là những điểm khởi đầu tuyệt vời để chứng minh giá trị của phân tích cảm tính – nhưng chúng chỉ chạm đến bề nổi sức mạnh thực sự của nó.

                      Đọc tiếp để biết từng bước về cách thức hoạt động của phân tích cảm tính.

                      Phân tích tình cảm hoạt động như thế nào?

                      Phân tích cảm xúc, còn được gọi là khai thác ý kiến, sử dụng thuật toán xử lý ngôn ngữ tự nhiên (nlp) và máy học để tự động xác định sắc thái cảm xúc đằng sau các cuộc trò chuyện trực tuyến.

                      Bạn có thể triển khai các thuật toán khác nhau trong mô hình phân tích cảm tính của mình, tùy thuộc vào lượng dữ liệu bạn cần phân tích và mức độ chính xác mà bạn muốn mô hình của mình trở nên chính xác. Chúng tôi thảo luận về một số trong số này chi tiết hơn dưới đây.

                      Thuật toán phân tích cảm tính thuộc một trong ba loại sau:

                      • Dựa trên quy tắc: Các hệ thống này tự động thực hiện phân tích cảm tính dựa trên một bộ quy tắc được xây dựng thủ công.
                      • Tự động: Hệ thống dựa vào các kỹ thuật máy học để học hỏi từ dữ liệu.
                      • Hệ thống

                      • Kết hợp kết hợp các phương pháp dựa trên quy tắc và tự động.
                      • Phương pháp dựa trên quy tắc

                        Xem Thêm : Bài luyện tập 2 chương 1 hóa 8: Bài 1, 2, 3, 4 trang 41 SGK

                        Thông thường, các hệ thống dựa trên quy tắc sử dụng một bộ quy tắc do con người tạo ra để giúp xác định các đối tượng có tính chủ quan, tính phân cực hoặc quan điểm.

                        Các quy tắc này có thể bao gồm các kỹ thuật nlp khác nhau được phát triển trong ngôn ngữ học tính toán, chẳng hạn như:

                        • Xuất bản, mã hóa, gắn thẻ và phân tích cú pháp một phần của bài phát biểu.
                        • Từ điển (nghĩa là danh sách từ và cách diễn đạt).
                        • Đây là một ví dụ cơ bản về cách thức hoạt động của một hệ thống dựa trên quy tắc:

                          1. Xác định hai danh sách các từ phân cực (ví dụ: các từ tiêu cực như xấu, tệ nhất, xấu xí, v.v. và các từ tích cực như tốt, tốt nhất, đẹp).
                          2. Đếm số từ tích cực và tiêu cực xuất hiện trong một văn bản nhất định.
                          3. Nếu số lần xuất hiện của các từ tích cực lớn hơn số lần xuất hiện của các từ tiêu cực, hệ thống sẽ trả về tình cảm tích cực và ngược lại. Nếu số chẵn, hệ thống sẽ trả về tâm lý trung lập.
                          4. Các hệ thống dựa trên quy tắc rất ngây thơ vì chúng không tính đến cách các từ được kết hợp theo trình tự. Tất nhiên, các kỹ thuật xử lý nâng cao hơn có thể được sử dụng và các quy tắc mới được thêm vào để hỗ trợ các biểu thức và từ vựng mới. Tuy nhiên, việc thêm các quy tắc mới có thể ảnh hưởng đến kết quả trước đó và toàn bộ hệ thống có thể trở nên rất phức tạp. Vì các hệ thống dựa trên quy tắc thường yêu cầu tinh chỉnh và bảo trì nên chúng cũng cần đầu tư thường xuyên.

                            Tự động đóng

                            Trái ngược với các hệ thống dựa trên quy tắc, các phương pháp tự động không dựa trên các quy tắc được xây dựng thủ công mà dựa trên các kỹ thuật máy học. Nhiệm vụ phân tích tình cảm thường được mô hình hóa dưới dạng bài toán phân loại, trong đó trình phân loại được cung cấp văn bản và trả về một lớp, chẳng hạn như tích cực, tiêu cực hoặc trung lập.

                            Một trình phân loại học máy được triển khai như sau:

                            Quá trình huấn luyện và dự đoán

                            Trong quá trình đào tạo (a), mô hình của chúng tôi học cách liên kết một đầu vào cụ thể (tức là văn bản) với một đầu ra (nhãn) tương ứng dựa trên các mẫu thử nghiệm được sử dụng để đào tạo. Trình trích xuất tính năng chuyển đổi đầu vào văn bản thành các vectơ đặc trưng. Đưa các cặp vectơ đặc trưng và nhãn (chẳng hạn như dương, âm hoặc trung tính) vào thuật toán máy học để tạo mô hình.

                            Trong quy trình dự đoán (b), một trình trích xuất đặc trưng được sử dụng để chuyển đổi đầu vào văn bản chưa nhìn thấy thành một vectơ đặc trưng. Các vectơ đặc trưng này sau đó được đưa vào mô hình, tạo ra nhãn dự đoán (một lần nữa, tích cực, tiêu cực hoặc trung lập).

                            Trích xuất tính năng văn bản

                            Bước đầu tiên trong quá trình máy học một bộ phân loại văn bản là chuyển đổi trích xuất văn bản hoặc vector hóa văn bản, phương pháp cổ điển là túi từ hoặc ngram và tần số của nó.

                            Gần đây, các kỹ thuật trích xuất tính năng mới dựa trên nhúng từ (còn được gọi là vectơ từ) đã được áp dụng. Cách biểu diễn này giúp các từ có nghĩa tương tự có cách biểu diễn tương tự, điều này có thể cải thiện hiệu suất của bộ phân loại.

                            Thuật toán phân loại

                            Bước phân loại thường liên quan đến các mô hình thống kê như Naive Bayes, hồi quy logistic, máy vectơ hỗ trợ hoặc mạng thần kinh:

                            • Naive Bayes: Một nhóm các thuật toán xác suất để dự đoán các thể loại văn bản sử dụng định lý Bayes.
                            • Hồi quy tuyến tính: Một thuật toán nổi tiếng trong thống kê để dự đoán một giá trị (y) cho một tập hợp các tính năng (x).
                            • Máy vectơ hỗ trợ: Một mô hình phi xác suất sử dụng các biểu diễn ví dụ văn bản dưới dạng các điểm trong không gian nhiều chiều. Ví dụ về các danh mục khác nhau (tình cảm) được ánh xạ tới các vùng khác nhau trong không gian này. Các văn bản mới sau đó được chỉ định một danh mục dựa trên sự tương đồng của chúng với các văn bản hiện có và các khu vực mà chúng ánh xạ tới.
                            • Học sâu: Một bộ thuật toán đa dạng cố gắng bắt chước bộ não con người bằng cách sử dụng mạng thần kinh nhân tạo để xử lý dữ liệu.
                            • Phương pháp kết hợp

                              Các hệ thống kết hợp kết hợp các yếu tố mong muốn của công nghệ tự động và dựa trên quy tắc vào một hệ thống. Một lợi ích to lớn của các hệ thống này là kết quả thường chính xác hơn.

                              Thử thách phân tích tình cảm

                              Phân tích cảm xúc là một trong những nhiệm vụ khó khăn nhất trong quá trình xử lý ngôn ngữ tự nhiên vì ngay cả con người cũng khó phân tích cảm xúc một cách chính xác.

                              Các nhà khoa học dữ liệu đang ngày càng giỏi hơn trong việc tạo ra các bộ phân loại cảm tính chính xác hơn, nhưng vẫn còn một chặng đường dài phía trước. Chúng ta hãy xem xét kỹ hơn một số thách thức chính của phân tích cảm tính dựa trên máy:

                              1. Tính chủ quan và giọng điệu chủ quan
                              2. Bối cảnh và phân cực
                              3. Mỉa mai & Trớ trêu
                              4. So sánh
                              5. Biểu tượng cảm xúc
                              6. Xác định trung lập
                              7. Độ chính xác do con người ghi nhãn
                              8. Tính chủ quan và giọng điệu

                                Có hai loại văn bản: chủ quan và khách quan. Các văn bản khách quan không chứa đựng tình cảm rõ ràng, trong khi các văn bản chủ quan thì có. Ví dụ: bạn muốn phân tích tình cảm của hai văn bản sau:

                                Đóng gói rất tốt.

                                Các gói có màu đỏ.

                                Hầu hết mọi người sẽ nói rằng cảm xúc đầu tiên là tích cực và cảm xúc thứ hai là trung tính, đúng không? Tất cả các vị ngữ (tính từ, động từ và một số danh từ) không nên được đối xử bình đẳng trong việc tạo ra cảm xúc. Trong ví dụ trên, đẹp mang tính chủ quan hơn màu đỏ.

                                Nền và phân cực

                                Tất cả các từ đều được nói vào một thời điểm nào đó, tại một nơi nào đó, bởi ai đó và với ai đó, và bạn hiểu điều đó. Tất cả các từ được nói trong ngữ cảnh. Phân tích tình cảm mà không có bối cảnh trở nên rất khó khăn. Tuy nhiên, nếu nó không được đề cập rõ ràng, máy không thể hiểu ngữ cảnh. Một trong những vấn đề do nền gây ra là sự thay đổi cực tính. Xem câu trả lời cho cuộc khảo sát bên dưới:

                                Mọi thứ về nó.

                                Hoàn toàn không!

                                Hãy tưởng tượng câu trả lời trên đến từ việc trả lời câu hỏi “Bạn thích điều gì ở sự kiện này?” Phản ứng đầu tiên là có, phản ứng thứ hai là tiêu cực, phải không? Bây giờ, hãy tưởng tượng rằng những phản hồi này đến từ câu trả lời cho câu hỏi Bạn không thích điều gì ở sự kiện này? Tiêu cực trong câu hỏi thay đổi hoàn toàn phân tích tình cảm.

                                Cần phải xử lý nhiều trước hoặc sau nếu chúng ta muốn xem xét ít nhất một phần ngữ cảnh của văn bản được tạo. Tuy nhiên, làm thế nào để xử lý trước hoặc sau khi xử lý dữ liệu để nắm bắt thông tin theo ngữ cảnh giúp phân tích tình cảm không đơn giản.

                                Mỉa mai và mỉa mai

                                Khi nói đến sự mỉa mai và mỉa mai, con người sử dụng những từ ngữ tích cực để bày tỏ cảm xúc tiêu cực của mình, điều mà máy móc khó phát hiện nếu không hiểu rõ ngữ cảnh mà họ bày tỏ cảm xúc.

                                Ví dụ: xem một số câu trả lời có thể có cho câu hỏi: Bạn có thích trải nghiệm mua sắm của chúng tôi không?

                                Vâng, tất nhiên rồi. mượt quá!

                                Không phải một mà rất nhiều!

                                Bạn nghĩ gì về những câu trả lời trên? Phản ứng đầu tiên với một dấu chấm than có lẽ là không, phải không? Vấn đề là không có tín hiệu văn bản nào có thể giúp máy học hỏi, hoặc ít nhất là đặt câu hỏi về tình cảm, vì vâng và chắc chắn thường là một văn bản tích cực hoặc trung lập.

                                Còn câu trả lời thứ hai thì sao? Trong trường hợp này, cảm xúc là tích cực, nhưng chúng tôi chắc rằng bạn có thể nghĩ ra nhiều tình huống khác nhau mà cùng một phản ứng có thể thể hiện cảm xúc tiêu cực.

                                So sánh

                                Cách xử lý các phép so sánh trong phân tích cảm tính là một thách thức khác đáng để giải quyết. Nhìn vào văn bản dưới đây:

                                Sản phẩm này là không ai sánh kịp.

                                Công cụ này tốt hơn công cụ cũ.

                                Xem Thêm: Ý nghĩa tên Tuệ Lâm là gì? Đặt tên con cao sang, phú quý, may mắn

                                Nói còn hơn không nói

                                So sánh đầu tiên không yêu cầu bất kỳ manh mối theo ngữ cảnh nào để phân loại chính xác. Rõ ràng, đây là một tích cực.

                                Tuy nhiên, văn bản thứ hai và thứ ba khó phân loại hơn. Bạn sẽ phân loại chúng là trung lập, tích cực hay thậm chí tiêu cực? Một lần nữa, bối cảnh có thể tạo ra sự khác biệt. Ví dụ: nếu “công cụ cũ” trong văn bản thứ hai được coi là vô dụng, thì văn bản thứ hai rất giống với văn bản thứ ba.

                                Biểu tượng cảm xúc

                                Theo Guibon và cộng sự, có hai loại biểu tượng cảm xúc. Biểu tượng cảm xúc phương Tây (ví dụ: :d) chỉ được mã hóa thành một hoặc hai ký tự, trong khi biểu tượng cảm xúc phương Đông (ví dụ: ¯ (ツ) / ¯ ) là tổ hợp ký tự dài hơn theo chiều dọc. Biểu tượng cảm xúc đóng một vai trò quan trọng trong cảm xúc văn bản, đặc biệt là trong các tweet.

                                Khi thực hiện phân tích cảm xúc trên các tweet, bạn cần đặc biệt chú ý đến cấp độ ký tự và cấp độ từ. Quá trình tiền xử lý mở rộng cũng có thể được yêu cầu. Ví dụ: bạn có thể muốn xử lý trước nội dung mạng xã hội và chuyển đổi biểu tượng cảm xúc phương Tây và phương Đông thành mã thông báo và đưa chúng vào danh sách cho phép (nghĩa là luôn đưa chúng vào làm tính năng cho mục đích phân loại) để giúp cải thiện hiệu suất phân tích cảm tính.

                                Dưới đây là danh sách đầy đủ các biểu tượng cảm xúc và các ký tự unicode của chúng, có thể hữu ích khi tiền xử lý.

                                Xác định trung lập

                                Việc xác định thế nào là trung lập là một thách thức khác cần được giải quyết để thực hiện phân tích cảm tính chính xác. Như với tất cả các bài toán phân loại, việc xác định các lớp (các nhãn trung lập trong trường hợp này) là một trong những phần quan trọng nhất của bài toán. Ý của bạn là trung lập, tích cực hay tiêu cực khi bạn đào tạo một mô hình phân tích tình cảm. Do dữ liệu được dán nhãn yêu cầu các tiêu chuẩn ghi nhãn nhất quán nên vấn đề phải được xác định rõ.

                                Dưới đây là một số ý tưởng giúp bạn xác định và xác định văn bản trung lập:

                                1. Văn bản đích. Cái gọi là văn bản khách quan không chứa tình cảm rõ ràng, vì vậy bạn nên xếp những văn bản này vào danh mục trung lập.
                                2. Thông tin không liên quan. Nếu bạn chưa xử lý trước dữ liệu để lọc ra thông tin không liên quan, bạn có thể đánh dấu dữ liệu đó là trung lập. Nhưng hãy cẩn thận! Chỉ làm điều này nếu bạn biết điều này sẽ ảnh hưởng đến hiệu suất tổng thể như thế nào. Đôi khi, bạn thêm tiếng ồn vào bộ phân loại và hiệu suất có thể trở nên tồi tệ hơn.
                                3. Chứa nội dung lời chúc. Một số mong muốn, như tôi muốn sản phẩm có tính tích hợp hơn, thường là trung tính. Tuy nhiên, những cái bao gồm so sánh, tôi hy vọng sản phẩm tốt hơn, thì khó phân loại
                                4. Độ chính xác do con người ghi nhãn

                                  Phân tích cảm tính là một nhiệm vụ khó khăn ngay cả đối với con người. Trung bình, sự đồng thuận giữa các người chú thích (thước đo mức độ hiệu quả của hai (hoặc nhiều) người chú thích có thể đưa ra quyết định về cùng một chú thích) là rất thấp khi phân tích cảm tính. Vì máy học từ dữ liệu được gắn nhãn nên bộ phân loại phân tích tình cảm có thể không chính xác như các loại bộ phân loại khác.

                                  Tuy nhiên, bạn nên nỗ lực phân tích cảm tính, ngay cả khi những dự đoán phân tích cảm tính của bạn đôi khi sai. Bằng cách sử dụng mô hình phân tích tình cảm của Monkeylearn, bạn có thể nhận được dự đoán chính xác khoảng 70-80% khi gửi văn bản để phân loại.

                                  Nếu chưa quen với phân tích cảm tính, bạn sẽ nhanh chóng nhận thấy sự cải thiện. Đối với các trường hợp sử dụng điển hình như định tuyến yêu cầu, giám sát thương hiệu và phân tích giọng hát, bạn sẽ tiết kiệm được rất nhiều thời gian và tiền bạc cho các tác vụ thủ công tẻ nhạt.

                                  Các trường hợp sử dụng & ứng dụng Phân tích cảm tính

                                  Các ứng dụng của phân tích cảm tính là vô tận và có thể được áp dụng cho bất kỳ ngành nào từ tài chính và bán lẻ đến khách sạn và công nghệ. Dưới đây, chúng tôi liệt kê một số cách phổ biến nhất mà phân tích cảm tính được sử dụng trong kinh doanh:

                                  Vào đêm định mệnh ngày 9 tháng 4 năm 2017, United Airlines đã buộc phải loại một hành khách khỏi chuyến bay đã đặt trước quá nhiều. Những hành khách khác đã quay lại sự kiện ác mộng bằng điện thoại thông minh của họ và đăng nó ngay lập tức. Một trong những video được đăng lên Facebook đã được chia sẻ hơn 87.000 lần và được xem 6,8 triệu lần vào lúc 6 giờ chiều thứ Hai, 24 giờ sau đó.

                                  Phản ứng bác bỏ của công ty chỉ làm trầm trọng thêm sự thất bại. Vào chiều thứ Hai, Giám đốc điều hành của United đã đưa ra một tuyên bố trên Twitter, xin lỗi vì “phải mở cửa trở lại cho khách hàng.”

                                  Đây chính xác là loại thảm họa PR mà bạn có thể tránh được bằng cách phân tích tình cảm. Đây là một ví dụ về lý do tại sao điều quan trọng là phải quan tâm, không chỉ việc mọi người đang nói về thương hiệu của bạn mà còn cả cách họ nói về thương hiệu đó. Nhiều đề cập không bằng đề cập tích cực.

                                  Các thương hiệu thuộc mọi loại hình và quy mô sử dụng mạng xã hội để tương tác một cách có ý nghĩa với khách hàng, khách hàng tiềm năng và thậm chí cả đối thủ cạnh tranh của họ. Bằng cách theo dõi các cuộc trò chuyện này, bạn có thể hiểu được tâm lý của khách hàng trong thời gian thực và theo thời gian, nhờ đó, bạn có thể phát hiện ngay những khách hàng không hài lòng và phản hồi nhanh nhất có thể.

                                  Hầu hết các bộ phận tiếp thị đã điều chỉnh lượt đề cập trực tuyến theo số lượng – họ đo lường mức độ nhận biết thương hiệu nhiều hơn. Nhưng các doanh nghiệp cần vượt ra ngoài những con số để có được những hiểu biết sâu sắc hơn.

                                  Giám sát thương hiệu

                                  Các thương hiệu có rất nhiều thông tin không chỉ trên mạng xã hội mà còn trên internet, các trang tin tức, blog, diễn đàn, bài đánh giá sản phẩm, v.v. Một lần nữa, chúng ta không chỉ có thể xem xét số lượng đề cập mà còn cả chất lượng cá nhân và tổng thể của những đề cập đó.

                                  Ví dụ như trong trường hợp United Airlines của chúng tôi, chỉ có một vài hành khách nổ ra xung đột trên tài khoản mạng xã hội của họ. Chỉ trong vòng vài giờ, thông tin này đã được các trang tin tức săn đón và lan truyền nhanh chóng khắp nước Mỹ, sau đó đến Trung Quốc và Việt Nam khi United Airlines bị cáo buộc có hành vi phân biệt chủng tộc đối với một hành khách người Việt gốc Hoa. Tại Trung Quốc, vụ việc đã trở thành chủ đề thịnh hành số một trên Weibo, một trang tiểu blog với gần 500 triệu người dùng.

                                  Và, tất cả chỉ diễn ra trong vài giờ ngắn ngủi sau khi vụ việc xảy ra.

                                  Giám sát thương hiệu cung cấp thông tin chi tiết phong phú từ các cuộc trò chuyện về thương hiệu của bạn trên Internet. Phân tích các bài báo, blog, diễn đàn, v.v. để đánh giá tình cảm thương hiệu và nhắm mục tiêu nhân khẩu học hoặc khu vực cụ thể khi cần. Tự động phân loại mức độ khẩn cấp của tất cả các đề cập đến thương hiệu và chuyển chúng ngay lập tức đến các thành viên được chỉ định trong nhóm.

                                  Hiểu cảm xúc và ý kiến ​​của khách hàng, không chỉ là những con số và thống kê. Xem hình ảnh thương hiệu của bạn đã phát triển như thế nào theo thời gian và so sánh nó với các đối thủ cạnh tranh của bạn. Bạn có thể điều chỉnh đến một thời điểm cụ thể để theo dõi các lần ra mắt sản phẩm, chiến dịch tiếp thị, hồ sơ IPO, v.v. và so sánh chúng với các sự kiện trong quá khứ.

                                  Phân tích cảm tính theo thời gian thực cho phép bạn xác định các cuộc khủng hoảng PR tiềm ẩn và thực hiện hành động ngay lập tức trước khi chúng trở thành vấn đề nghiêm trọng. Hoặc xác định các đánh giá tích cực và trả lời trực tiếp để tận dụng chúng làm lợi thế cho bạn.

                                  Ví dụ: expedia của Canada

                                  Vào khoảng dịp Giáng sinh, expedia canada đã chạy một chiến dịch cổ điển ‘Trốn khỏi mùa đông’. Mọi thứ đều ổn ngoại trừ tiếng vĩ cầm rít lên mà họ chọn làm nhạc nền. Có thể hiểu được, mọi người bắt đầu sử dụng phương tiện truyền thông xã hội, blog và diễn đàn. Expedia nhận thấy điều đó ngay lập tức và xóa quảng cáo.

                                  Sau đó, họ thực hiện một loạt video phụ tiếp theo: một trong những diễn viên ban đầu đập đàn vĩ cầm; Mặc dù chiến dịch ban đầu của họ thất bại, nhưng Expedia đã có thể tự chuộc lỗi bằng cách lắng nghe và phản hồi khách hàng của họ.

                                  Phân tích cảm tính cho phép bạn tự động theo dõi tất cả các cuộc thảo luận xung quanh thương hiệu của mình, đồng thời phát hiện và giải quyết các tình huống có khả năng bùng nổ như vậy trong khi bạn vẫn có thời gian để xoa dịu nó.

                                  Ý kiến ​​của khách hàng (voc)

                                  Việc giám sát thương hiệu và phương tiện truyền thông xã hội cung cấp cho chúng tôi thông tin tức thì, chưa được lọc và có giá trị về cảm tính của khách hàng, nhưng bạn cũng có thể sử dụng phân tích này để khảo sát và tương tác với bộ phận hỗ trợ khách hàng.

                                  Khảo sát Net Promoter Score (nps) là một trong những cách phổ biến nhất để doanh nghiệp nhận phản hồi bằng một câu hỏi đơn giản: Bạn có muốn giới thiệu công ty, sản phẩm và/hoặc dịch vụ này cho bạn bè hoặc thành viên gia đình không? Những kết quả này tạo thành một số điểm trên thang số.

                                  Các doanh nghiệp sử dụng những điểm số này để xác định khách hàng là Người quảng bá, Người thụ động hoặc Người gièm pha. Mục tiêu là xác định trải nghiệm tổng thể của khách hàng và tìm cách nâng tất cả khách hàng lên cấp độ “người giới thiệu”, theo lý thuyết, họ sẽ mua nhiều hơn, ở lại lâu hơn và giới thiệu những khách hàng khác.

                                  Xem Thêm : Soạn bài Nghị luận về một ý kiến bàn về văn học siêu ngắn

                                  Dữ liệu khảo sát dạng số (định lượng) dễ dàng được tổng hợp và đánh giá. Nhưng câu hỏi tiếp theo trong các cuộc khảo sát nps hỏi tại sao những người tham gia khảo sát lại bỏ dở những điểm họ đã làm, tìm kiếm các câu trả lời mở hoặc dữ liệu định tính.

                                  Các câu trả lời khảo sát mở trước đây khó phân tích hơn, nhưng với phân tích cảm tính, có thể tách các văn bản này thành tích cực và tiêu cực (và mọi thứ ở giữa) để tìm hiểu thêm về tiếng nói của khách hàng (voc).

                                  Bạn có thể sử dụng phân tích cảm tính trong bất kỳ loại khảo sát nào (định lượng và định tính) cũng như trong các tương tác hỗ trợ khách hàng để hiểu cảm xúc và ý kiến ​​của khách hàng. Việc theo dõi cảm tính của khách hàng theo thời gian có thể bổ sung thêm chiều sâu để giúp hiểu tại sao điểm số nps hoặc cảm tính đối với các khía cạnh khác nhau của doanh nghiệp bạn có thể thay đổi.

                                  Bạn có thể sử dụng điều này trong các cuộc khảo sát sắp tới và yêu cầu hỗ trợ để phát hiện những khách hàng “rất tiêu cực” và nhắm mục tiêu họ ngay lập tức cho dịch vụ của bạn. Không tập trung vào một số nhân khẩu học nhất định để hiểu những gì hoạt động tốt nhất và cách cải thiện.

                                  Số liệu phân tích theo thời gian thực cho phép bạn thấy các thay đổi về giọng nói ngay lập tức và hiểu được các sắc thái của trải nghiệm khách hàng theo thời gian, chứ không chỉ là số liệu thống kê và tỷ lệ phần trăm.

                                  Tìm hiểu cách chúng tôi phân tích cảm xúc của hàng nghìn bình luận trên Facebook và biến chúng thành thông tin chi tiết hữu ích.

                                  Ví dụ: dự án McKinsey City Voices

                                  Ở Brazil, chi tiêu công của liên bang đã tăng 156% từ năm 2007 đến năm 2015, trong khi mức độ hài lòng với các dịch vụ công giảm dần. Không hài lòng với tiến độ phản tác dụng này, bộ phận quy hoạch thành phố đã thuê McKinsey để giúp họ tập trung vào trải nghiệm người dùng hoặc “hành trình của công dân” khi cung cấp dịch vụ của họ. Cách tiếp cận quản trị lấy người dân làm trung tâm này đã cho phép phát triển cái mà chúng ta gọi là thành phố thông minh.

                                  McKinsey đã phát triển một công cụ có tên là Tiếng nói của Thành phố để khảo sát công dân về hơn 150 chỉ số, sau đó tiến hành phân tích cảm tính để giúp các nhà lãnh đạo hiểu cách các thành phần khác nhau sống và những gì họ cần, để cung cấp thông tin chính sách công tốt hơn. Sử dụng công cụ này, chính phủ Brazil đã có thể xác định các nhu cầu cấp thiết nhất – chẳng hạn như hệ thống giao thông công cộng an toàn hơn – và cải tiến mũi nhọn.

                                  Nếu đây là một thành công quốc gia, hãy tưởng tượng nó có thể làm gì cho công ty của bạn.

                                  Dịch vụ khách hàng

                                  Chúng ta đã xem xét cách sử dụng phân tích cảm tính về mặt giọng nói chung của nhóm, vì vậy bây giờ chúng ta sẽ quay số trong nhóm dịch vụ khách hàng.

                                  Tất cả chúng ta đều biết điều này: trải nghiệm khách hàng tuyệt vời đồng nghĩa với nhiều khách hàng lặp lại hơn. Các công ty biết cách họ cung cấp cũng quan trọng, nếu không muốn nói là quan trọng hơn những gì họ cung cấp. Khách hàng mong đợi trải nghiệm của họ với một công ty phải nhanh chóng, trực quan, được cá nhân hóa và không gặp rắc rối. Nếu không, họ bỏ đi và kinh doanh ở nơi khác. Bạn có biết rằng cứ ba khách hàng thì có một người sẽ rời bỏ thương hiệu sau một trải nghiệm tồi tệ?

                                  Bạn có thể sử dụng tính năng phân tích cảm tính và phân loại văn bản để tự động sắp xếp các yêu cầu hỗ trợ sắp tới theo chủ đề và mức độ khẩn cấp, chuyển chúng đến đúng bộ phận và đảm bảo rằng các vấn đề khẩn cấp nhất sẽ được xử lý ngay lập tức.

                                  Phân tích các tương tác hỗ trợ khách hàng để đảm bảo nhân viên của bạn tuân thủ các quy trình phù hợp. Tăng hiệu quả để khách hàng không phải chờ hỗ trợ. Giảm tình trạng rời bỏ; xét cho cùng, việc giữ chân khách hàng sẽ dễ dàng hơn là có được những khách hàng mới.

                                  Tìm hiểu cách chúng tôi phân tích các tương tác hỗ trợ khách hàng trên twitter.

                                  Nghiên cứu thị trường

                                  Phân tích cảm tính hỗ trợ nhiều nghiên cứu thị trường và phân tích cạnh tranh. Cho dù bạn đang khám phá thị trường mới, dự đoán xu hướng trong tương lai hay tìm kiếm lợi thế so với đối thủ cạnh tranh, phân tích cảm tính có thể đóng một vai trò quan trọng.

                                  Xem Thêm: Bệnh Viện Phụ Sản Trung Ương | 43, Tràng Thi, Phường Hàng

                                  Bạn có thể phân tích các bài đánh giá trực tuyến về sản phẩm và so sánh chúng với các đối thủ cạnh tranh của mình. Có thể đối thủ cạnh tranh của bạn đã phát hành một sản phẩm mới và nó thất bại. Tìm ra những khía cạnh nào của sản phẩm của bạn hoạt động kém nhất và sử dụng điều đó để làm lợi thế cho bạn.

                                  Theo dõi thương hiệu và đối thủ cạnh tranh của bạn trong thời gian thực trên mạng xã hội. Nhắm mục tiêu các thị trường mới nơi thương hiệu của bạn có khả năng thành công. Phát hiện xu hướng kịp thời hoặc theo dõi xu hướng thị trường dài hạn bằng cách phân tích các báo cáo thị trường chính thức và tạp chí kinh doanh.

                                  Bạn sẽ tiếp xúc với các nguồn thông tin mới và có thể định lượng thông tin định tính bổ sung. Với phân tích dữ liệu xã hội, bạn có thể lấp đầy khoảng trống khi dữ liệu công khai khan hiếm, chẳng hạn như ở các thị trường mới nổi.

                                  Tìm hiểu cách phân tích cảm tính của các bài đánh giá khách sạn trên tripadvisor hoặc thực hiện phân tích cảm tính trên các bài đánh giá nhà hàng trên yelp.

                                  Hướng dẫn & Công cụ phân tích tình cảm

                                  Phân tích cảm tính là một chủ đề rộng lớn có thể khiến bạn nản lòng lúc đầu. May mắn thay, có rất nhiều tài nguyên hữu ích, từ các hướng dẫn hữu ích đến nhiều công cụ trực tuyến miễn phí, có thể giúp bạn thực hiện những bước đầu tiên.

                                  Công cụ phân tích tình cảm trực tuyến miễn phí

                                  Một khởi đầu thuận lợi cho hành trình của bạn là chỉ cần sử dụng công cụ phân tích cảm tính. Một số trải nghiệm trực tiếp sẽ giúp bạn hiểu cách thức hoạt động của nó

                                  Tiếp theo, để tiến thêm một bước trong việc phân tích cảm tính, bạn sẽ thử phân tích cảm tính của Monkeylearn và các mẫu từ khóa. Trước tiên, bạn cần đăng ký, sau đó hoàn thành các bước sau:

                                  1. Chọn Từ khóa + Mẫu phân tích cảm tính

                                  2. Tải lên dữ liệu của bạn

                                  Nếu không có tệp csv, bạn có thể sử dụng tập dữ liệu mẫu của chúng tôi.

                                  3. Khớp các cột csv với các trường trong bảng điều khiển

                                  Trong mẫu này, chỉ có một trường duy nhất: văn bản. Nếu bạn có nhiều cột trong tập dữ liệu của mình, hãy chọn cột chứa văn bản bạn muốn phân tích.

                                  4. Đặt tên cho quy trình công việc của bạn

                                  5. Đang đợi dữ liệu của bạn được nhập

                                  6. Khám phá trang tổng quan của bạn!

                                  Bạn có thể:

                                  • Lọc theo cảm tính hoặc từ khóa.
                                  • Chia sẻ với các đồng nghiệp khác qua email.
                                  • Các công cụ phân tích tình cảm mã nguồn mở và saas (phần mềm dưới dạng dịch vụ)

                                    Khi nói đến phân tích cảm tính (và phân tích văn bản nói chung), bạn có hai lựa chọn: xây dựng giải pháp của riêng mình hoặc mua một công cụ.

                                    Các thư viện mã nguồn mở bằng các ngôn ngữ như python và java đặc biệt phù hợp để xây dựng các giải pháp phân tích cảm tính của riêng bạn vì cộng đồng của các thư viện này thiên về khoa học dữ liệu hơn, chẳng hạn như xử lý ngôn ngữ tự nhiên và học sâu để phân tích cảm tính. Nhưng bạn cần một nhóm các nhà khoa học dữ liệu và kỹ sư, rất nhiều khoản đầu tư ban đầu và thời gian rảnh rỗi.

                                    Các công cụ của Saas cung cấp tùy chọn để triển khai ngay lập tức mô hình phân tích cảm tính được đào tạo trước hoặc đào tạo tùy chỉnh của riêng bạn, thường chỉ trong vài bước. Những công cụ này được khuyến nghị nếu bạn không có nhóm khoa học dữ liệu hoặc kỹ thuật, vì chúng có thể được triển khai mà không cần hoặc có ít mã và có thể giúp bạn tiết kiệm hàng tháng làm việc và tiền bạc (tối đa 100.000 USD).

                                    Một lợi thế lớn khác của các công cụ saas là bạn thậm chí không cần phải biết cách viết mã; chúng cung cấp khả năng tích hợp với các ứng dụng của bên thứ ba như tích hợp zendesk, excel và zapier của Monkeylearn.

                                    Nếu bạn muốn bắt đầu sử dụng các công cụ có sẵn này, hãy xem hướng dẫn này về các công cụ saas tốt nhất để phân tích cảm tính cũng đi kèm với apis tích hợp liền mạch với các công cụ hiện có của bạn.

                                    Hoặc bắt đầu tìm hiểu cách thực hiện phân tích cảm tính bằng cách sử dụng API của Monkeylearn và các mô hình phân tích cảm tính được tạo sẵn chỉ trong sáu dòng mã. Sau đó, đào tạo mô hình phân tích tình cảm tùy chỉnh của riêng bạn bằng cách sử dụng giao diện người dùng dễ sử dụng của Monkeylearn.

                                    • Hướng dẫn phân tích tình cảm trong python sử dụng api của Monkeylearn.
                                    • Nếu bạn vẫn tin rằng mình cần xây dựng giải pháp phân tích cảm tính của riêng mình, hãy xem các công cụ và hướng dẫn này bằng nhiều ngôn ngữ lập trình khác nhau:

                                      Trăn phân tích tình cảm

                                      • scikit-learning là thư viện đáng tin cậy dành cho máy học, với các công cụ hữu ích để vector hóa văn bản. Đào tạo các bộ phân loại dựa trên vector hóa, chẳng hạn như bộ vector hóa văn bản tần số hoặc tf-idf rất đơn giản. scikit-learning có triển khai Support Vector Machines, Naive Bayes và Logistic Regression, trong số những thứ khác.
                                      • nltk là thư viện nlp truyền thống của python. Nó có một cộng đồng tích cực và cung cấp khả năng đào tạo các bộ phân loại học máy.
                                      • spacy là một thư viện nlp có cộng đồng đang phát triển. Giống như nltk, nó cung cấp một tập hợp mạnh mẽ các chức năng cấp thấp cho nlp và hỗ trợ đào tạo các trình phân loại văn bản.
                                      • Tensorflow do Google phát triển cung cấp một bộ công cụ cấp thấp để xây dựng và đào tạo mạng lưới thần kinh. Vector hóa văn bản cũng được hỗ trợ, bao gồm tần số từ truyền thống và nhúng từ chuyển qua nâng cao hơn.
                                      • Keras cung cấp các khái niệm trừu tượng hữu ích để xử lý một số loại mạng nơ-ron như mạng nơ-ron hồi quy (rnns) và mạng nơ-ron tích chập (cnn) cũng như các lớp chồng nơ-ron đơn giản. máy ảnh có thể chạy trên tenorflow hoặc theano. Nó cũng cung cấp các công cụ hữu ích để phân loại văn bản.
                                      • pytorch là một framework deep learning mới ra mắt gần đây, được hỗ trợ bởi các tổ chức nổi tiếng như facebook, twitter, nvidia, salesforce, đại học stanford, đại học oxford và uber. Nó nhanh chóng phát triển thành một cộng đồng mạnh mẽ.
                                      • Hướng dẫn dùng thử:

                                        • Dò web bằng python và phân tích cảm tính: Hướng dẫn này cung cấp hướng dẫn từng bước về cách phân tích 100 subreddit hàng đầu theo cảm tính. Nó giải thích cách sử dụng beautiful soup, một trong những thư viện python phổ biến nhất, để thu thập tên của các trang subreddit hàng đầu (các subreddit như /r/funny, /r/askreddit và /r/todayilearned).

                                          Sử dụng thư viện praw, trình bày cách tương tác với api reddit và trích xuất nhận xét từ các subreddits này. Sau đó, tìm hiểu cách sử dụng textblob để thực hiện phân tích cảm tính đối với các bài đánh giá được trích xuất. Mã: https://github.com/jg-fisher/redditsentiment

                                        • Phân tích cảm tính Twitter bằng python và nltk: Hướng dẫn từng bước này chỉ cho bạn cách huấn luyện bộ phân loại cảm tính đầu tiên của mình. Các tác giả đào tạo một trình phân loại trên các tweet bằng bộ công cụ ngôn ngữ tự nhiên nltk. Phân tích tình cảm trở nên dễ dàng với scikit-learning: Hướng dẫn này chỉ ra cách đào tạo mô hình hồi quy logistic để phân tích tình cảm.

                                        • Phân tích cảm tính dễ dàng với scikit-learning: Hướng dẫn này cho biết cách huấn luyện mô hình hồi quy logistic để phân tích cảm tính.

                                          JavaScript phân tích tình cảm

                                          java là một ngôn ngữ lập trình khác có cộng đồng mạnh về khoa học dữ liệu và cung cấp các thư viện khoa học dữ liệu tuyệt vời cho nlp.

                                          • opennlp: Một bộ công cụ hỗ trợ các tác vụ nlp phổ biến nhất, chẳng hạn như mã thông báo, phân đoạn câu, gắn thẻ một phần của bài phát biểu, trích xuất thực thể có tên, phân đoạn, phân tích cú pháp, phát hiện ngôn ngữ và giải quyết tham chiếu chính.
                                          • stanford corenlp: Bộ công cụ nlp lõi java do nhóm nlp stanford cung cấp.
                                          • lingpipe: Bộ công cụ java để xử lý văn bản bằng ngôn ngữ học tính toán. lingpipe thường được sử dụng để phân loại văn bản và trích xuất thực thể.
                                          • weka: Một bộ công cụ do Đại học Waikato tạo ra để xử lý trước, phân loại, hồi quy, phân cụm, quy tắc kết hợp và trực quan hóa dữ liệu.
                                          • Các khóa học & nghiên cứu phân tích tình cảm

                                            Sau khi tìm hiểu những kiến ​​thức cơ bản về phân tích cảm tính và thấy nó có thể giúp ích cho bạn như thế nào, bạn có thể muốn tìm hiểu sâu hơn về chủ đề này:

                                            Bài phân tích tình cảm

                                            Tài liệu về phân tích tình cảm rất phong phú; có hơn 55.700 bài báo học thuật, luận án, luận án, sách và tóm tắt.

                                            Sau đây là những bài báo được đọc và trích dẫn nhiều nhất trong cộng đồng phân tích tình cảm nói chung:

                                            • Khai thác ý kiến ​​và phân tích tình cảm (pang và lee, 2008)
                                            • Nhận biết tính phân cực theo ngữ cảnh trong phân tích tình cảm ở cấp độ cụm từ (Wilson, Wiebe, & Hoffmann, 2005).
                                            • Khảo sát phân tích tình cảm và khai thác ý kiến ​​(Liu và Zhang, 2012)
                                            • Phân tích tình cảm và khai thác ý kiến ​​(liu, 2012)
                                            • Cách khai thác văn bản bằng phân tích tình cảm
                                            • Sách phân tích tình cảm

                                              bing liu là một nhà lãnh đạo tư tưởng trong lĩnh vực máy học và là tác giả của một cuốn sách về phân tích tình cảm và khai thác ý kiến.

                                              Hữu ích cho những người bắt đầu nghiên cứu về phân tích tình cảm, Liu đã làm rất tốt việc giải thích phân tích tình cảm theo cách kỹ thuật cao nhưng dễ tiếp cận. Trong cuốn sách, ông đề cập đến các khía cạnh khác nhau của phân tích tình cảm bao gồm các ứng dụng, nghiên cứu, phân loại tình cảm bằng cách sử dụng học tập có giám sát và không giám sát, tính chủ quan của câu, phân tích tình cảm dựa trên khía cạnh, v.v.

                                              Để biết phần giới thiệu về các phương pháp phân tích tình cảm dựa trên học sâu, một lĩnh vực nghiên cứu tương đối mới và đang phát triển nhanh chóng, hãy xem Phương pháp phân tích tình cảm dựa trên học sâu.

                                              Các khóa học và bài giảng về phân tích tình cảm

                                              Một cách tuyệt vời khác để tìm hiểu sâu hơn về phân tích tình cảm là thu thập kiến ​​thức và kỹ năng về xử lý ngôn ngữ tự nhiên (nlp), một lĩnh vực khoa học máy tính tập trung vào việc hiểu ngôn ngữ của “con người”.

                                              Bằng cách kết hợp máy học, ngôn ngữ học máy tính và khoa học máy tính, NLP cho phép máy hiểu ngôn ngữ tự nhiên, bao gồm cảm xúc, đánh giá, thái độ và cảm xúc mà con người thể hiện từ ngôn ngữ viết.

                                              Có rất nhiều khóa học, bài giảng và tài nguyên trực tuyến, nhưng khóa học NLP bắt buộc phải có là khóa học Stanford của Dan Zhuravsky và Christopher Manning. Khi tham gia khóa học này, bạn sẽ xem qua phần giới thiệu về lĩnh vực này của hai trong số những tên tuổi uy tín nhất trong cộng đồng nlp.

                                              Nếu muốn tham gia khóa học thực hành nhiều hơn, bạn nên đăng ký Khoa học dữ liệu: Xử lý ngôn ngữ tự nhiên (NLP) bằng Python trên Udemy. Khóa học này là phần giới thiệu hữu ích về nlp và các khả năng của nó, nhưng nó cũng sẽ cho phép bạn xây dựng các dự án khác nhau trong python, bao gồm trình phát hiện thư rác, trình phân tích tình cảm và trình quay bài viết. Hầu hết các bài giảng đều ngắn (khoảng 5 phút) và khóa học đạt được sự cân bằng hợp lý giữa nội dung lý thuyết và thực hành.

                                              Tập dữ liệu phân tích tình cảm

                                              Một phần quan trọng của việc thành thạo phân tích cảm tính là làm việc với các tập dữ liệu khác nhau và thử các cách tiếp cận khác nhau. Trước tiên, bạn cần lấy dữ liệu của mình và lấy tập dữ liệu mà bạn sẽ sử dụng cho các thử nghiệm của mình.

                                              Dưới đây là một số bộ dữ liệu phân tích tình cảm yêu thích của chúng tôi để thử nghiệm các phương pháp học máy và phân tích tình cảm. Chúng được mở và tải xuống miễn phí:

                                              • Đánh giá sản phẩm: Tập dữ liệu này chứa hàng triệu bài đánh giá của khách hàng Amazon với xếp hạng sao và hữu ích cho việc huấn luyện các mô hình phân tích cảm tính.
                                              • Đánh giá về nhà hàng: Bộ dữ liệu này chứa 5,2 triệu đánh giá trên yelp có gắn sao.
                                              • Đánh giá phim: Tập dữ liệu này chứa 1.000 bài đánh giá tích cực đã được xử lý và 1.000 bài đánh giá tiêu cực. Nó cũng cung cấp 5.331 câu/đoạn được xử lý tích cực và 5.331 tiêu cực.
                                              • Đánh giá đồ ăn: Bộ dữ liệu này chứa ~500.000 bài đánh giá đồ ăn từ Amazon. Nó bao gồm thông tin về sản phẩm và người dùng, xếp hạng và phiên bản văn bản thuần túy của mỗi bài đánh giá.
                                              • Twitter tình cảm của hãng hàng không trên kaggle: Bộ dữ liệu này chứa khoảng 15.000 tweet được gắn nhãn (tích cực, trung lập và tiêu cực) về các hãng hàng không.
                                              • Tình cảm trên Twitter về cuộc tranh luận đầu tiên của Đảng Cộng hòa: Bộ dữ liệu này chứa ~14.000 tweet được gắn nhãn (tích cực, trung lập và tiêu cực) về cuộc tranh luận đầu tiên của Đảng Cộng hòa vào năm 2016.
                                              • Nếu bạn quan tâm đến cách tiếp cận dựa trên quy tắc, thì đây là các từ điển phân tích tình cảm khác nhau có thể hữu ích. Các từ điển này cung cấp một tập hợp các từ điển từ có nhãn chỉ định cảm xúc của chúng trong các lĩnh vực khác nhau. Các từ điển sau đây rất hữu ích để xác định cảm xúc của văn bản:

                                                • Từ vựng về tình cảm cho 81 ngôn ngữ: Tập dữ liệu này chứa các từ vựng về tình cảm tích cực và tiêu cực cho 81 ngôn ngữ.
                                                • sentiwordnet: Tập dữ liệu này chứa khoảng 29.000 từ với điểm cảm tính từ 0 đến 1.
                                                • Từ điển ý kiến ​​để phân tích tình cảm: Bộ dữ liệu này cung cấp danh sách bằng tiếng Anh gồm 4.782 từ tiêu cực và 2.005 từ tích cực.
                                                • wordstat Từ điển tình cảm: Tập dữ liệu này chứa khoảng 4800 từ tích cực và khoảng 9000 từ tiêu cực.
                                                • Từ điển cảm xúc biểu tượng cảm xúc: Tập dữ liệu này chứa danh sách 477 biểu tượng cảm xúc được gắn nhãn tích cực, trung lập hoặc tiêu cực.
                                                • Từ chia tay

                                                  Phân tích cảm tính có thể được áp dụng cho vô số khía cạnh của hoạt động kinh doanh, từ giám sát thương hiệu và phân tích sản phẩm, đến dịch vụ khách hàng và nghiên cứu thị trường. Bằng cách tích hợp nó vào các hệ thống và phân tích hiện có, các thương hiệu hàng đầu (chưa kể đến toàn bộ thành phố) có thể hoạt động nhanh hơn và chính xác hơn cho các mục đích hữu ích hơn.

                                                  Phân tích cảm tính không còn chỉ là một thú vui công nghệ cao, nó sẽ sớm trở thành một công cụ không thể thiếu đối với tất cả các công ty hiện đại. Cuối cùng, phân tích tình cảm cho phép chúng tôi thu thập những hiểu biết sâu sắc mới, hiểu khách hàng của mình hơn và trao quyền hiệu quả hơn cho các nhóm của chúng tôi để họ có thể làm việc tốt hơn và hiệu quả hơn.

                                                  monkeylearn là một nền tảng trực tuyến cho phép bạn dễ dàng thực hiện phân tích văn bản bằng các công cụ trực quan hóa dữ liệu và máy học.

                                                  Nếu bạn cần trợ giúp xây dựng hệ thống phân tích cảm tính cho doanh nghiệp của mình, hãy truy cập monkeylearn studio và yêu cầu bản trình diễn.

                                                  Bài viết liên quan

                                                  • Đám mây từ miễn phí tốt nhất để trực quan hóa dữ liệu của bạn
                                                  • Trực quan hóa cảm xúc trong đám mây từ
                                                  • Trích xuất Từ khóa: Hướng dẫn Tìm Từ khóa trong Văn bản

Nguồn: https://anhvufood.vn
Danh mục: Giáo Dục

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *