Squeak.ru - шаблоны программирования

Неправильно проиндексированные массивы char [] в Visual Studio 2005

Я не могу объяснить, что, кажется, неправильно адресуется в char[] массивах класса C ++, который я унаследовал. Я использую Visual Studio 2005 и сузил проблему до следующего:

MyClass.h:

class MyClass {
public:
  MyClass();
  virtual ~MyClass();
  void Reset();
  // More member functions. . .

  char m_szString[128];
  // More member variables. . .
}

MyClass.cpp:

MyClass::MyClass() { Reset(); }
MyClass::Reset()   { m_szString[0] = 'X'; }
// . . .

Пошагово просматривая программу, я обнаружил, что функция Reset() фактически устанавливает m_szString[ 4 ] в 'X', а не m_szString[ 0 ], как я ожидал. Согласно окну просмотра, единственный элемент в классе перед m_szString[] - это указатель на vftable, __vfptr, который занимает 4 байта.

Если я добавлю больше переменных-членов в MyClass, последующие строки будут неправильно адресованы различными, постоянно увеличивающимися числами, кратными 4 байтам. Не просто выровненным по 4-байтовым границам, а фактически смещением, кратным 4. Это как если бы компилятор пропускал в два раза необходимое пространство для каждого vftable ... но это чисто предположение.

Сообщалось о примерно похожих проблемах (Google, MSDN), но я не нашел ответов.


Дополнительная информация / частичное решение. Класс - единственная переменная-член класса-оболочки, которая становится библиотекой DLL. Родитель изначально был объявлен как

class ATL_NO_VTABLE CWrapperClass

Удаление ATL_NO_VTABLE устранило проблему выравнивания.

Я все еще наблюдаю переполнение буфера, но его довольно легко отследить.

Можете ли вы объяснить ATL_NO_VTABLE в терминах, понятных разработчику встроенных C, который имеет очень ограниченный опыт работы с COM за пределами BSTR, или, что еще лучше, предоставить указатель (извините) на хорошую ссылку?


Еще больше: Этот вопрос содержит некоторую полезную информацию по отладке.

Спасибо за вашу помощь.


  • Можете ли вы использовать операторы печати и попробовать это в режиме выпуска? 11.03.2009
  • Можете ли вы привести полный рабочий пример, демонстрирующий проблему? 11.03.2009
  • Должно быть нечто большее, чем вы здесь упоминаете - например, комментарий о модулях корректора вызывает у меня подозрения. 11.03.2009
  • @ Андрей: Как я теперь понимаю, так оно и есть. Я все еще копаюсь в коде, еще больше сбиваю с толку COM. Спасибо за стимул продолжать копать! 11.03.2009

Ответы:


1

Здесь два вопроса:

  • В чем проблема? Я не имею в виду то, что кажется подозрительным в отладчике, но что на самом деле идет не так на верхнем уровне? То, что вы видите в отладчике, может быть результатом оптимизации, а не реальной ошибкой.
  • У вас есть минимальный код, воспроизводящий ошибку? Вышесказанное мне мало что говорит. Если бы я раньше столкнулся с точно той же проблемой, это могло бы быть полезно, но я не сделал этого. Итак, если я хотел воспроизвести проблему, что мне делать?
11.03.2009
  • Спасибо за ответ! Первым признаком был отладчик, сообщающий о переполнении буфера, возвращенном функцией, использующей этот класс. Дальнейшая проверка показала, что массивы char [] не были настроены должным образом, что в конечном итоге привело к наблюдению «выключено на 4». Все оптимизации отключены. 11.03.2009

  • 2

    Мое первое предположение - компиляция с включенной непреднамеренной оптимизацией.

    Мое второе предположение - что-то странное происходит с поддержкой юникода (например, char vs wchar_t).

    11.03.2009
  • Спасибо за твои мысли. Проблема была определенно ATL_NO_VTABLE, вероятно, связанной с COM. Запись строки символов в массив фактически записывает правильные символы в последовательные элементы; это только смещение было неправильным. Я четыре раза проверил все оптимизации - они отключены. 11.03.2009

  • 3

    Ответ

    Фактически, компилятор вычислял неверный адрес для некоторых членов класса. Причиной оказалась директива #pragma pack 1, спрятанная в неясном заголовочном файле, который был #included в некоторых исходных файлах.

    Как я это нашел

    50% настойчивости, 50% удачи и 10% математических навыков. :-)

    Я наткнулся на очень простой класс с несколькими методами и членами, большинство из которых были определены в файле заголовка, в том числе:

    typedef int BOOL;  // Legacy, makes my skin crawl; don't ask.
    BOOL isConnected() { return m_bConnected; };
    BOOL m_bConnected;
    

    ... и функция вернула false, когда я знал m_bConnected было true:

    • Окно просмотра показало правильное значение. Программные изменения m_bConnected были отражены в окне.
    • Наблюдение за &m_bConnected показало, что класс начинается с 8 байтов.
    • Окно необработанной памяти показало правильное значение. Там же были отражены программные изменения для m_bConnected.
    • Все 4 байта перед m_bConnected были 0, что я интерпретировал как заполнение.
    • Пошаговое выполнение отладчика кода ясно показало, что возвращаемое значение равно false!

    Итак, я проверил окно разборки и нашел это (мои комментарии):

    mov    eax,dword ptr [this]        ; address of the class instance
    mov    eax,dword ptr [eax+4]       ; offset to m_bConnected
    

    Другими словами, компилятор рассчитал смещение как 4, хотя должно было быть 8.

    Ага!

    Интересно, что когда я удалил определение isConnected() из заголовка и поместил его в свой исходный файл, адрес был вычислен правильно! Это убедило меня, что это действительно проблема упаковки, и поиск в базе кода для #pragma pack быстро выявил виновника, древний файл заголовка, который (законно) требовал выравнивания по 1-байтовым границам, но никогда не сбрасывал упаковку до значений по умолчанию. .

    Исправление

    Решение было так же просто, как заключить оскорбительный заголовок следующим образом:

    #pragma pack(push)
    // original code here
    #pragma pack(pop)
    

    Спасибо за ваш интерес. И Сара, если вы читаете, я собираюсь танцевать на моем столе!

    30.03.2009

    4

    Всегда лучше завершить строку нулем, прежде чем вы начнете использовать. Сделав это даже во время отладки, вы получите более четкое представление о массиве. Более того, вы публично объявляли m_szString. Лучше объявить массив в частной области и вернуть его с помощью функции-члена

    12.03.2009
  • Верно, но все это не имеет отношения к вопросу. Независимо от того, как какой-либо из элементов объявлен или инициализирован, индексация всегда должна быть правильной. Это не вопрос лучших практик; это вопрос о том, как компилятор вычисляет адреса. 12.03.2009
  • Новые материалы

    Угловая структура архитектуры
    Обратите внимание, что эта статья устарела, я решил создать новую с лучшей структурой и с учетом автономных компонентов: https://medium.com/@marekpanti/angular-standalone-architecture-b645edd0d54a..

    «Данные, которые большинство людей используют для обучения своих моделей искусственного интеллекта, поставляются со встроенным…
    Первоначально опубликовано HalkTalks: https://hacktown.com.br/blog/blog/os-dados-que-a-maioria-das-pessoas-usa-para-treinar-seus-modelos-de-inteligencia-artificial- ja-vem-com-um-vies-embutido/..

    Сильный ИИ против слабого ИИ: различия парадигм искусственного интеллекта
    В последние годы изучению и развитию искусственного интеллекта (ИИ) уделяется большое внимание и прогресс. Сильный ИИ и Слабый ИИ — две основные парадигмы в области искусственного интеллекта...

    Правильный способ добавить Firebase в ваш проект React с помощью React Hooks
    React + Firebase - это мощная комбинация для быстрого и безопасного создания приложений, от проверки концепции до массового производства. Раньше (знаете, несколько месяцев назад) добавление..

    Создайте API с помощью Python FastAPI
    Создание API с помощью Python становится очень простым при использовании пакета FastAPI. После установки и импорта вы можете создать приложение FastAPI и указать несколько конечных точек. Каждой..

    Веселье с прокси-сервером JavaScript
    Прокси-серверы JavaScript — это чистый сахар, если вы хотите создать некоторую общую логику в своих приложениях, чтобы облегчить себе жизнь. Вот один пример: Связь клиент-сервер Мы..

    Получить бесплатный хостинг для разработчиков | Разместите свой сайт за несколько шагов 🔥
    Статические веб-сайты — это веб-страницы с фиксированным содержанием и его постоянным содержанием. Но теперь статические сайты также обрабатывают динамические данные с помощью API и запросов...